IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 关于统计样本协方差矩阵与其特征值的一点思考 -> 正文阅读

[人工智能]关于统计样本协方差矩阵与其特征值的一点思考

????????要研究统计量,当然是要先有样本,首先,随机生成一堆二维坐标点,如图所示。

图1 二维样本点坐标表示

????????从图中可以看出,坐标点平铺于二维平面(而不是在一条直线上),所以不用担心协方差矩阵不可逆的问题。

????????首先用矩阵的方法表示这些点

?\mathbf{X}=\begin{bmatrix} x_{1}^{1}&x_{1}^{2}&...&x_{1}^{n}\\ x_{2}^{1}&x_{2}^{2}&...&x_{2}^{n} \end{bmatrix}

????????其中,统计向量还是按列向量表示,其上标表示序列标号而不是数值乘方运算。

????????在这样表示的前提下,对协方差矩阵的可以写为:

\mathbf{D}=\frac{\mathbf{(X-\mu)(X-\mu)^{T}}}{n-1}=\frac{1}{n-1}\sum_{i-1}^{n}\begin{bmatrix} x_{1}^{i}-\mu_{1}\\ x_{2}^{i}-\mu_{2} \end{bmatrix}\begin{bmatrix} x_{1}^{i}-\mu_{1}& x_{2}^{i}-\mu_{2} \end{bmatrix}

????????其中\mu表示统计样本在各个维度上的均值,换句话说,(\mathbf{X-\mu})的操作或\begin{bmatrix} x_{1}^{i}-\mu_{1}\\ x_{2}^{i}-\mu_{2} \end{bmatrix}的操作其实就是让样本进行中心化,使得样本的均值中心处于坐标原点。中心化后样本长这样

图2 中心化后样本点

?????????那么通过上面的运算我们也就得到了协方差矩阵\mathbf{D}针对上面的样本,协方差矩阵大概长这个样子:

\mathbf{D}=\begin{bmatrix} 21.5495 & -6.2597\\ -6.2597 & 12.4563 \end{bmatrix}

????????无论是从上面的矩阵看还是从协方差的性质上分析都能得出矩阵\mathbf{D}是对称矩阵,根据对称矩阵的性质我们可以得知其对角化公式为:

\mathbf{D=P\Lambda P^{T}}

????????把上面的协方差矩阵公式代进来,再稍微变换一下就可以得到:

\mathbf{\Lambda }=\frac{1}{n-1}\mathbf{P^{T}(X-\mu)(X-\mu)^{T}P}=\frac{1}{n-1}\mathbf{[P^{T}(X-\mu)][P^{T}(X-\mu)]^{T}}

????????为了后期方便解读与表示,这里规定特征向量矩阵\mathbf{P}单位化矩阵

????????我们先将上面所用例子的数值贴出来,再对公式进行解读。

\mathbf{\Lambda }=\begin{bmatrix} 24.9375 & 0\\ 0& 9.2663\end{bmatrix},\mathbf{P}=\begin{bmatrix} -0.8910& -0.4541\\ 0.4541& -0.8910 \end{bmatrix}

????????经乘\mathbf{p^{T}}变换后的样本\mathbf{[P^{T}(X-\mu)]}形式如图所示

图3 通过特征向量矩阵变换后的样本点

?????????从公式中可以解读出以下几点:

  1. ?协方差矩阵的特征向量的转置\mathbf{p^{T}}相当于一个坐标变换,对列向量(\mathbf{X-\mu})的坐标变换。
  2. 变换后的列向量样本\mathbf{[P^{T}(X-\mu)]}求其协方差,得到的是一个对角矩阵\Lambda也就是在非对角线上的元素全为0。
  3. 结合第1和第2条,\Lambda?作为协方差矩阵,只有对角元素不为0这一性质说明了该统计样本的每一个维度都是相互独立的,即变换后的样本\mathbf{[P^{T}(X-\mu)]}x_{1}x_{2}维度上相互独立,这将极大程度的利于我们对统计量的分析。
  4. 由于前面规定了特征向量矩阵\mathbf{P}单位化矩阵,所以变换后的样本\mathbf{[P^{T}(X-\mu)]}尺度并不会改变,换句话说,原样本(\mathbf{X-\mu})经乘\mathbf{p^{T}}变换后,并没有发生伸缩变换,所以其离散程度依然不变,\Lambda中的数值反应的仍然是原样本(\mathbf{X-\mu})的方差,只是采用的投影方向(向x1轴和x2轴投影,如下图所示)不一样。

图4(a) 变换前样本点在x1和x2轴投影(红线为特征向量的基)
图4(b) 变换后样本点在x1和x2轴投影(红线为特征向量的基,此时与x1和x2重合)

??????????到这里其实一切都可以揭秘了,生成样本的matlab的函数为:

X1=normrnd(5,5,1000,1);
X2=normrnd(10,3,1000,1);
X=[x1 x2]*[cos(pi/6) -sin(pi/6);sin(pi/6) cos(pi/6)];

?????????即生成了均值为5和10,方差为5和3的1000个独立高斯分布样本,也就是生成样本满足:

X_{1} \sim N(5,25)

X_{2} \sim N(10,9)

????????再对分布的坐标进行旋转使其产生带有协方差的样本\mathbf{X}

? ? ? ? 注意这里讲的是生成\mathbf{X}的方法,上面分析第4条讲的是对已经生成的\mathbf{X}的变换,不要混淆。?

????????实际上我们发现计算得出的\Lambda其对角线上的元素正好是旋转前的两个独立分布的方差,这种情况只是一种巧合,因为我们只使用了旋转变换,并不改变样本点间的距离,若是更具有一般性的仿射变换则就不会有那么幸运了。

图5(a)?变换前样本点在x1和x2轴投影(红线为特征向量的基)

图5(b) 变换后样本点在x1和x2轴投影(红线为特征向量的基,此时与x1和x2重合)

?????????在这里,

\Lambda =\begin{bmatrix} 41.5433 & 0\\ 0&0.6806 \end{bmatrix}

????????虽然生成时采用了相同的分布,但是对生成样本进行了不同的变换,其得出的对角化方差也不同,但尽管如此,结合图示,我们依然可以得出结论,使用协方差矩阵的特征向量对统计样本进行变换,可以消除联合分布的关系,使得不同维度样本独立。

????????进一步分析还可知,若如图4(a)那样对x1轴和x2轴进行投影求方差,只能求得协方差矩阵\mathbf{D}的对角元素,即21.5495和12.4563,而协方差-6.2597被忽略,这造成了“信息的浪费”。而对样本进行变换后再对x1轴和x2轴进行投影求方差,便可得到“最大化的方差信息”,这也是PCA(主成分分析)的核心思想,当然上述从信息量角度进行分析并不严谨,详细的证明可以参考PCA的证明方法。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-01 14:30:37  更:2021-08-01 14:32:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 10:55:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码