#3. VOC 2021人车检测

CV L2 标准

题目描述

检测出图片中的人和汽车,输出刚好能围住他们的矩形边界框

输入:

[3, H, W]的图像array。三个维度分别是图像的通道、高度、宽度。元素值为对应位置的像素值

输出:

[2, 100, 5]的array

第一维:类别(0是人,1是汽车)

第二维:检测数量(如果小于100,用全零填充)

第三维:[x1, y1, x2, y2, confidence],前四个值是边界框顶点坐标,第五个是置信度

样例输入

一个图像array,表示的图像里有一个人,没有汽车

样例输出

一个[2, 100, 5]的array,[0, 0]是[x1, y1, x2, y2, 0.95],(x1, y1)和(x2, y2)两个点定义的矩形刚好围住图像中的人。array的其他元素都是0

数据范围与提示

评测系统支持的任一类别的最大检测数量为100,但这只表示所有样本中任一类别的实际数量小于等于100,不包含其他信息。实际数量接近/远低于100都有可能