| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> CV的数据获取和处理 -> 正文阅读 |
|
[人工智能]CV的数据获取和处理 |
图形处理的一般流程1.图片数据获取 3.图片数据标注 一 中心化 = 去均值 mean normallization 一 将各个维度中心化到0 一 目的是加快收敛速度,在某些激活函数上表现更好 一 归一化 = 除以标准差 一 将各个维度的方差标准化处于[-1,1]之间 一 目的是提高收敛效率,统一不同输入范围的数据对于模型学习的影响,映射到激活函数有效梯度的值域 5.图片数据准备data preparation(训练+测试阶段) 6.图片数据增强data augjmentation(训练阶段 ) · 随机旋转 · 随机水平或者重直翻转 · 缩放 · 剪裁 · 平移 · 调整亮度、对比度、饱和度、色差等等 · 注入噪声 · 基于生成对抗网络GAN做数搪增强AutoAugment等 一.数据集的获取1.1Kaggel1.2百度的AI Studio这个是我平时用的比较多的一个数据集的网站,因为配合百度自己的飞浆paddle使用的话比较方便。 1.3天池1.4科大讯飞1.5coco这个网站需要科学上网才能进入。 二.自定义的数据集在cv的项目中,大部分情况下,你要做的目标可能在网上找不到适合的数据集,这时候你就需要自己制作数据集。 2.1 常见的标注工具labelme和labelimg的区别:labelme可以将物体的轮廓标注出来,常用于分割,数据输出为.json。labelimg是一种矩形标注工具,常用于目标识别和目标检测,其标记数据输出为.xml和txt 使用labelimg的标注 三.图片数据预处理3.1中心化中心化就是零均值化,对于每一个元素减去本图像的平均值即可。中心化本质上是将所有的像素值在坐标轴上进行了一次平移。 E(X-E(X))=0 对于预测函数,我们常使用的激活函数,比如sigmoid,relu,tanh,他们的任意一点的导数均大于零。
3.2 标准化标准化为减均值除以标准差,这样出来的分布符合标准正态分布
四.数据增强随着神经网络的加深,需要学习的参数也会随之增加,这样就会更容易导致过拟合,当数据集较小的时候,过多的参数会拟合数据集的所有特点,而非数据之间的共性。那什么是过拟合呢,之前的博客有提到,指的就是神经网络可以高度拟合训练数据的分布情况,但是对于测试数据来说准确率很低,缺乏泛化能力。 因此在这种情况下,为了防止过拟合现象,数据增强应运而生。当然除了数据增强,还有正则项/dropout等方式可以防止过拟合。那接下来讨论下常见的数据增强方法。 1)随机旋转 因为很多深度学习的模型复杂度太高了,且在数据量少的情况下,比较容易造成过拟合(通俗来说就是训练的这个模型它太沉浸在这个训练样本当中的一些特质上面了),表现为的这个模型呢受到了很多无关因素的影响。 所得出的结果就是在没有看到过的样本上对它做出预测呢就表现的不太好。 以下是对图片的预处理
运行结果
运行结果
运行结果 这里是对数据的增强
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 9:54:39- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |