IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 神经网络训练输入特征处理 -> 正文阅读

[人工智能]神经网络训练输入特征处理

1. 特征预处理

参考:
https://www.codenong.com/cs109471668/
https://www.zhihu.com/question/20455227

样本维度:

  1. 删除重复数据
  2. 删除占比过多的用户样本(采样)
  3. 删除异常样本(业务判断)
  4. 样本顺序要打乱:因为使用 mini-batch 学习方法,防止一个批次的样本有顺序关系,消除收敛波动

特征维度:

  1. 缺失值处理:填充 -1,或者平均值填充等
  2. 离散、异常特征处理:去除异常特征对应的样本,按照分位截断填充某一固定值

相关特征处理:

  1. 输入特征最好不相关。如果某些维输入的相关性太强,那么网络中与这些输入神经元相连的权重实际上起到的作用就是相似的,训练网络时花在调整这些权重之间关系上的力气就白费了

特征归一化:

  1. 归一化的作用是消除量纲(理解为计量单位如年龄 & 财富)差异。如果不归一化,梯度下降类似于一个很扁的椭圆形,寻找谷底的过程,会发现长轴方向梯度反而小,短轴方向梯度反而大。这样,长轴方向就收敛过慢,短轴方向就容易爆掉
  2. 归一化然后训练出模型后,如果想利用模型进行未知样本的求算,需要把归一化训练数据时使用的参数(均值、方差等)记录下来,同样用到测试数据上(线上推断)
  3. 基于最大最小值的[0,1]归一化要稍微好一些,归一化比不归一化要稍好一些,但是,如果max和min不稳定,很容易使得归一化结果不稳定,使得后续使用效果也不稳定,实际使用中可以用经验常量值来替代max和min。而且当有新数据加入时,可能导致max和min的变化,需要重新定义
  4. 如果归一化之后很多数据都集中在一个小区间,会导致这些数据的特征不能被学习。比如 数据分布在(10000,20000),归一化到(0,1)之间,对于10001和10008这两个数据,会变成0.0001和0.0008,这样两个数据在训练的时候估计只会增大网络收敛的难度。
  5. 如果归一化依据异常点进行的话,最后的结果就会产生很大的偏差。所以在归一化很适合精确且规模相对小一些的数据集,一般在归一化之前可以先检查数据,排除异常点的影响。
  6. bp中常采用sigmoid函数作为转移函数,归一化能够防止净输入绝对值过大引起的神经元输出饱和现象
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-28 12:23:44  更:2021-10-28 12:26:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 6:32:46-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码