IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数据集的获取 -> 正文阅读

[人工智能]数据集的获取

一、数据集的获取

1.Kaggle:https://www.kaggle.com
2.天池:https://tianchi.aliyun.com/dataset
3.DataFountain:https://www.datafountain.cn/datasets

二、完整流程概述

1、图像处理完整流程

  1. 图片数据获取
  2. 图片数据清洗
    ??----初步了解数据,筛选掉不合适的图片
  3. 图片数据标注
  4. 图片数据预处理data preprocessing
    ??----标准化 standardlization
    ????一 中心化 = 去均值 mean normallization
    ??????一 将各个维度中心化到0
    ??????一 目的是加快收敛速度,在某些激活函数上表现更好
    ???? 一 归一化 = 除以标准差
    ??????一 将各个维度的方差标准化处于[-1,1]之间
    ??????一 目的是提高收敛效率,统一不同输入范围的数据对于模型学习的影响,映射到激活函数有效梯度的值域
  5. 图片数据准备data preparation(训练+测试阶段)
    ??----划分训练集,验证集,以及测试集
  6. 图片数据增强data augjmentation(训练阶段 )
    ??----CV常见的数据增强
    ?????? · 随机旋转
    ?????? · 随机水平或者重直翻转
    ?????? · 缩放
    ?????? · 剪裁
    ?????? · 平移
    ?????? · 调整亮度、对比度、饱和度、色差等等
    ?????? · 注入噪声
    ?????? · 基于生成对抗网络GAN做数搪增强AutoAugment等

2、纯数据处理完整流程

1.感知数据
??----初步了解数据
??----记录和特征的数量特征的名称
??----抽样了解记录中的数值特点描述性统计结果
??----特征类型
??----与相关知识领域数据结合,特征融合
2.数据清理
??----转换数据类型
??----处理缺失数据
??----处理离群数据
3.特征变换
??----特征数值化
??----特征二值化
??----OneHot编码
??----特征离散化特征
??----规范化
????区间变换
????标准化
????归一化
4.特征选择
??----封装器法
????循序特征选择
????穷举特征选择
????递归特征选择
??----过滤器法
??----嵌入法
5.特征抽取
??----无监督特征抽取
????主成分分析
????因子分析
??----有监督特征抽取

三、数据处理的方法

1、数据增强

为什么要做这些数据增强?
是因为很多深度学习的模型复杂度太高了,且在数据量少的情况下,比较容易造成过拟合(通俗来说就是训练的这个模型它太沉浸在这个训练样本当中的一些特质上面了),表现为的这个模型呢受到了很多无关因素的影响。
所得出的结果就是在没有看到过的样本上对它做出预测呢就表现的不太好。

四、图像分类

1、位图

特点
?由像素点定义一放大会糊
?文件体积较大
?色彩表现丰富逼真

2、矢量图

特点
?超矢量定义
?放太不模糊
?文件体积较小
?表现力差

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-30 22:43:54  更:2021-07-30 22:44:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/17 20:33:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码