归一化(Normalization):将数据变换到 某个固定区间中,通常是 [0,1]
归一化(?min-max?Normalization)
=
x
i
?
x
m
i
n
x
m
a
x
?
x
m
i
n
(?mean?Normalization)
=
x
i
?
m
e
a
n
(
x
)
x
m
a
x
?
x
m
i
n
\text{归一化( min-max Normalization)} =\frac{x_i-x_{min}}{x_{max}-x_{min}} \\ \quad \\ \qquad \qquad\text{( mean Normalization)} =\frac{x_i-mean(x)}{x_{max}-x_{min}}
归一化(?min-max?Normalization)=xmax??xmin?xi??xmin??(?mean?Normalization)=xmax??xmin?xi??mean(x)?
标准化(Standardization) :将数据变换为均值为0,标准差为1 的分布「??不一定是正态分布 ,标准化时,会改变 均值/标准差,但是 分布规律是不会改变的」随机变量
X
X
X服从期望为
μ
\mu
μ ,方差为
σ
2
\sigma ^{2}
σ2的正态分布,记为
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)。当
μ
=
0
,
σ
=
1
\mu = 0,\sigma = 1
μ=0,σ=1时为标准正态分布。
标准化(Standardization)
=
x
i
?
μ
σ
\text{标准化(Standardization)}=\frac{x_i-\mu}{\sigma}
标准化(Standardization)=σxi??μ?
中心化:也称为零均值处理,就是将每个数据减去数据集的均值
中心化
=
X
i
?
X
m
e
a
n
\text{中心化}=X_i - X_{mean}
中心化=Xi??Xmean?