IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数据预处理:标准化与正则化的作用及区别 -> 正文阅读

[人工智能]数据预处理:标准化与正则化的作用及区别

引言

数据标准化和正则化是数据挖掘和机器学习的常用术语,本文简要阐述标准化和正则化的作用及区别,以便更好的从数据中发现和学习知识。

方法

标准化和正则化都是数据预处理过程中常用的方法,对于数据的进一步分析和处理具有重要意义。

数据标准化

数据标准化是将样本的属性缩放到某个指定的范围。

标准化的作用或意义是什么?

  • 某些算法要求样本具有零均值和单位方差
  • 需要消除样本不同属性具有不同量级时的影响
    • 数量级的差异将导致量级较大的属性占据主导地位
    • 数量级的差异将导致迭代收敛速度减慢
    • 依赖于样本距离的算法对于数据的数量级非常敏感

标准化常用的两种方法是:min-max标准化(归一化) 和 z-score标准化(规范化)。

min-max标准化(归一化):对于每个属性,设 minAmaxA 分别为属性 A 的最小值和最大值,将 A 的一个原始值 x 通过 min-max 标准化映射成在区间 [0, 1] 的值 x',其公式为:

x ′ = x ? m i n A m a x A ? m i n A x' = \frac{x-minA}{maxA-minA} x=maxA?minAx?minA?

z-score标准化(规范化):基于原始数据的均值(mean)和标准差(standard deviation,简记为 std)进行数据的标准化。将 A 的一个原始值 x 使用z-score标准化到 x'。z-score标准化方法适用于属性 A 的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况,其公式为:

x ′ = x ? m e a n s t d x' = \frac{x-mean}{std} x=stdx?mean?

数据正则化

数据正则化是将样本的某个范数(如 L 1 L_{1} L1?范数)缩放到单位1。正则的过程是针对单个样本的,将每个样本缩放到单位范数。通常使用二次型(如点积)或者其他核方法计算两个样本之间的相似性。首先对样本求 L p L_{p} Lp?范数,然后对该样本的每个属性值除以该样本的 L p L_{p} Lp?范数。

参考

内容节选自海豚大数据实验室。若想进一步了解可参阅这篇文章。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-04 15:33:38  更:2022-03-04 15:37:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 17:19:44-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码