| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 百度飞桨第2课|数据集的获取途径和数据处理的技巧 -> 正文阅读 |
|
[人工智能]百度飞桨第2课|数据集的获取途径和数据处理的技巧 |
1 数据集的获取:
2 数据处理:
???COCO数据集是Microsoft制作收集用于Detection + Segmentation + Localization + Captioning的数据集,作者收集了其2017年的版本,一共有25G左右的图片和600M左右的标签文件。 COCO数据集共有小类80个,分别为:
????????大类12个,分别为
????????VOC与COCO简介? ??Pascal 的全称是模式分析,静态建模和计算学习(Pattern Analysis, Statical Modeling and Computational Learning)。PASCAL?VOC 挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。从2005年至今,该组织每年都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法,仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率 ?? MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。 下面为大家演示一下标注的使用。 ????????COCO格式,文件夹路径样式:
????????VOC格式,文件夹路径样式:?
3 数据处理方法:
??我们常见的图片其实分为两种,一种叫位图,另一种叫做矢量图。 位图的特点:
矢量图的特点:
?? 是因为很多深度学习的模型复杂度太高了,且在数据量少的情况下,比较容易造成过拟合(通俗来说就是训练的这个模型它太沉浸在这个训练样本当中的一些特质上面了),表现为的这个模型呢受到了很多无关因素的影响。 所得出的结果就是在没有看到过的样本上对它做出预测呢就表现的不太好。 4 模型训练与评估:4.1 比对实验在其他参数都相同的情况下,在没有加任何的数据增强时,mAP为38.06: 在其他参数都相同的情况下,在随机扩张,随机像素变换数据增强时,mAP为41.9: 在其他参数都相同的情况下,在加随机裁剪,随机水平翻转,短边调整,与Mixup的数据增强时,mAP为35.4: 以上对比实验说明,正确的增加数据增强时,可以小幅度提升mAP值。 4.2 拓展介绍mAP:在机器学习领域中,用于评价一个模型的性能有多种指标,其中几项就是FP、FN、TP、TN、精确率(Precision)、召回率(Recall)、准确率(Accuracy)。 mean Average Precision, 即各类别AP的平均值,是AP:PR 曲线下面积。 此前先了解一下IOU评判标准: TP、FP、FN、TN 常见的评判方式,第一位的T,F代表正确或者错误。第二位的P和N代表判断的正确或者错误
查准率(Precision): Precision?=TPTP+FP=TP?all?detections?=\frac{T P}{T P+F P}=\frac{T P}{\text { all detections }}=TP+FPTP?=?all?detections?TP? 查全率(Recall): Recall?=TPTP+FN=TP?all?ground?truths?=\frac{T P}{T P+F N}=\frac{T P}{\text { all ground truths }}=TP+FNTP?=?all?ground?truths?TP? 5 模型推理预测:使用模型进行预测,同时使用pdx.det.visualize将结果可视化,可视化结果将保存到work/PaddleDetection/output/PPYOLO/vdl_log下,载入模型推理保存图片至work/PaddleDetection/output/PPYOLO/img下。 In [?]
In [?]
6 总结:????????本次课程主要学习了数据集获取,以及数据标注、数据划分、数据增强处理方法。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:37:46- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |