- 关于CoCo数据集:
- 是大规模的数据集。
- 是目标检测领域一个比较有名的数据集
- 包含了自然图片,生活中常见的目标图片,背景比较复杂,目标数量比较多,目标尺寸更小,所以在该数据集上的任务更难。
- 对于检测任务,衡量一个模型的好坏更倾向于使用CoCo数据集上的检测结果。
- COCO有5种类型的标注,分别是:物体检测、关键点检测、实例分割、全景分割、图片标注,都是对应一个json文件。
- 根据任务记录相关数据集:
- 图像分类任务:
- 分类需要二进制的标签来确定目标是否在图像中。
- 著名的数据集有CIFAR-10 和CIFAR-100(在32X32图像上分别提供10和100类),imagenet(22000类,每类500-1000图像)
- 目标检测:
- 通过bounding box确定目标位置。
- 数据集:
- caltech pedestrian detaset(包含350000个bounding box标签),PASCAL VOC数据(包括20个目标,over11000图像,over27000个目标bounding box)
- imagenet数据下获取的detection数据集(200类,400000张图像,350000个bounding box)。
- 由于一些目标之间有着强烈的关系而非独立存在,在特定场景下检测某种目标是是否有意义的,因此精确的位置信息比bounding box更加重要。
- 语义场景标注:需要像素级的标签。数据集主要包括室内场景和室外场景的,一些数据集包括深度信息。SUN dataset(包含908个场景类,3819个常规目标类(person, chair, car)和语义场景类(wall, sky, floor),每类的数目具有较大的差别)
- 其他数据集:Middlebury datasets,包含立体相对,多视角立体像对和光流;Berkeley Segmentation Data Set (BSDS500)可评价分割和边缘检测算法
参考:目标检测数据集MSCOCO详解 - 知乎 (zhihu.com)
|