IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Linux下载VOC数据集 -> 正文阅读

[人工智能]Linux下载VOC数据集

Linux下载VOC数据集

1、VOC数据集简介

PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。VOC官网:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
简言之,VOC是 (Visual Object Classes)的简称,它是一套检测和识别标准化的数据集,可以说是该类数据集的开山之作, 后续的很多数据集,都是在此基础上的扩展。 目前应用最广的是VOC 2007和VOC 2012,即在2007推出的VOC和2012年推出的。

1.1 VOC的任务

**分类:**在测试图像预测是否为二十个分类之一,正确分类
**检测:**在测试图像上预测二十个分类对象的有无与位置信息
**分割:**对每个对象与类别生成像素级别的分割标签,确定像素是为目标20个分类或者背景。

此外Pascal VOC还提供一些很有意思的标注数据包括Action Classification (行为识别)、Human Layout(人体Layout分析)等。
**行为识别:**预测图像中人的行为动作
**Person Layout:**检测人与其各个身体组成部分,如果手、脚、头等

1.2 VOC的构成

PASCAL VOC 2007 和 2012 数据集总共分 4 个大类:vehicle、household、animal、person,总共 20 个小类(加背景 21 类),预测的时候是只输出下图中黑色粗体的类别。
在这里插入图片描述
目前目标检测常用的是 VOC2007 和 VOC2012 数据集,因为二者是互斥的。
VOC2007 和 VOC2012 目标检测任务中的训练、验证和测试数据统计如下表所示(trainval是train和val的合并)
在这里插入图片描述

1.3 组织结构

,因为我下载的是VOC2012数据集,因此以 VOC 2012为例,解压后的文件为:

└── VOCdevkit     #根目录
    └── VOC2012   #不同年份的数据集,这里只下载了2012的,还有2007等其它年份的
        ├── Annotations        #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
        ├── ImageSets          #该目录下存放的都是txt文件,txt文件中每一行包含一个图片的名称,末尾会加上±1表示正负样本
        │   ├── Action
        │   ├── Layout
        │   ├── Main           #存放的是分类和检测的数据集分割文件
        │   └── Segmentation
        ├── JPEGImages         #存放源图片
        ├── SegmentationClass  #存放的是图片,语义(class)分割相关
        └── SegmentationObject #存放的是图片,实例(object)分割相关

├── Main
│   ├── train.txt 写着用于训练的图片名称, 共 2501 个
│   ├── val.txt 写着用于验证的图片名称,共 2510 个
│   ├── trainval.txt train与val的合集。共 5011 个
│   ├── test.txt 写着用于测试的图片名称,共 4952 个

下面分别介绍一下每个文件夹中的内容:

1.3.1 Annotations

标签文件,使用labelImg进行标注,xml主要介绍了对应图片的基本信息,如来自哪个文件夹、文件名、来源、图像尺寸以及图像中包含哪些目标以及目标的信息等等,xml内容如下:

<annotation>
    <folder>VOC2012</folder> # 文件名
    <filename>2007_000027.jpg</filename>
    <source>
       <database>The VOC2007 Database</database>
       <annotation>PASCAL VOC2007</annotation>
       <image>flickr</image>
   </source>
   <size> # 图像尺寸, 用于对 bbox 左上和右下坐标点做归一化操作
       <width>486</width>
       <height>500</height>
       <depth>3</depth>
   </size>
   <segmented>0</segmented> # 是否用于分割,1有分割标注,0表示没有分割标注。
   <object>  
       <name>person</name> # 物体类别
       <pose>Unspecified</pose> # 拍摄角度:front, rear, left, right, unspecified 
       <truncated>0</truncated> # 目标是否被截断(比如在图片之外),或者被遮挡(超过15%)
       <difficult>0</difficult> # 检测难易程度,这个主要是根据目标的大小,光照变化,图片质量来判断,0表示不是,1表示是
       <bndbox>
           <xmin>174</xmin>
           <ymin>101</ymin>
           <xmax>349</xmax>
           <ymax>351</ymax>
       </bndbox>
   <part>
       <name>head</name>
       <bndbox>
           <xmin>169</xmin>
           <ymin>104</ymin>
           <xmax>209</xmax>
           <ymax>146</ymax>
       </bndbox>
   </part>
   <part>
       <name>hand</name>
       <bndbox>
   </object>
</annotation>

1.3.2 ImageSets

ImageSets包含如下四个子文件夹:Action、Layout、Main、Segmentation。里面是标注类别的每个文件列表信息:

  1. Action中是所有具有Action标注信息图像文件名的txt文件列表;
  2. Layout中的txt文件表示包含Layout标注信息的图像文件名列表;
  3. Main文件夹中包含20个类别每个类别一个txt文件,每个txt文件都是包含该类别的图像文件名称列表;
  4. Segmentation则是包含语义分割信息图像文件的列表。

在main中针对每个类别都有个三个文件,分别为:

CLASSNAME_train.txt
CLASSNAME_trainval.txt
CLASSNAME_val.txt

以CLASSNAME = aeroplane为例,main中的三个文件分别为:

aeroplane_train.txt
aeroplane_trainval.txt
aeroplane_val.txt

每个类别txt文件里面的内容格式为 :图像文件名 + 空格 + 标记,以aeroplane_train.txt中的举例如下:
2008_000290 0
2008_000291 1
2008_000297 -1

其中2008_000290、2008_000291、2008_000297表示三张图像文件名

0 表示图像中包含aeroplane对象但是难识别样本
1 表示图像中包含aeroplane
-1 表示图像中不包含aeroplane

1.3.3 JPEGImages

VOC所有的原始图像文件,格式必须是JPG格式,这个要特别注意!如果你打算使用VOC2012格式生成数据,那么原始图像格式在采样时候请用JPG格式保存,避免后期生成使用的时候出错。

1.3.4 SegmentationClass

所有分割的图像标注,分割图像按照每个类别标注的数据(语义分割)

1.3.5 SegmentationObject

所有分割的图像标注,分割图像按照每个类别每个对象不同标注的数据(实例分割)

2、Linux环境下载数据集

1、打开Linux终端

2、进入到自己的环境和相应的文件夹内,输入下列语句,等待下载安装即可

下面是VOC2007和VOC2012的数据集压缩包
wget http://pjreddie.com/media/files/VOC2012test.tar
wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

wget https://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar
wget https://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar
在这里插入图片描述

原文链接:https://blog.csdn.net/cengjing12/article/details/107820976
参考链接:https://blog.csdn.net/qq_29007291/article/details/85333890
链接:https://www.jianshu.com/p/67014920d2ab

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-25 11:36:15  更:2022-05-25 11:36:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 4:51:03-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码