原视频链接:PyTorch深度学习目标检测入门实战系列【土堆 x 布尔艺数】
下载VOC数据集
下载地址:http://host.robots.ox.ac.uk/pascal/VOC/
数据集里面都有什么
- Annotations 标注文件夹(包含xml文件,图片的各种信息)
- ImageSets 图片集合(主要关注Main文件夹的内容)
- JPEGImages 数据集包含的图片
- SegmentationClass 语义分割图片
- SegmentationObject 实例分割图片
需要关注的是ImageSets
打开ImageSets-Main-aeroplane_train.txt 可以看到32和33为1,在JPEGImages中,32号的图片
打开Annotations
打开Annotations-000032.xml
<object>
<name>aeroplane</name><图片类别名字>
<pose>Frontal</pose><拍摄物体的角度,可以看出是在前面拍的>
<truncated>0</truncated><有无被截断,0是无>
<difficult>0</difficult><识别出来是否困难,0代表不困难>
<bndbox>
<xmin>104</xmin><物体在图片上横坐标最小值>
<ymin>78</ymin><物体在图片上纵坐标最小值>
<xmax>375</xmax><物体在图片上横坐标最大值>
<ymax>183</ymax><物体在图片上纵坐标最大值>
</bndbox>
</object>
下载COCO数据集
官网:https://cocodataset.org/#home
解读Annotations
从第一行开始扫描,是46格像素,到第三行才出现白色的像素,一行一行的扫描 “counts”:[147,3,1…]
未完待续
|