| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 关于统计样本协方差矩阵与其特征值的一点思考 -> 正文阅读 |
|
[人工智能]关于统计样本协方差矩阵与其特征值的一点思考 |
????????要研究统计量,当然是要先有样本,首先,随机生成一堆二维坐标点,如图所示。 ????????从图中可以看出,坐标点平铺于二维平面(而不是在一条直线上),所以不用担心协方差矩阵不可逆的问题。 ????????首先用矩阵的方法表示这些点 ? ????????其中,统计向量还是按列向量表示,其上标表示序列标号而不是数值乘方运算。 ????????在这样表示的前提下,对协方差矩阵的可以写为: ????????其中表示统计样本在各个维度上的均值,换句话说,的操作或的操作其实就是让样本进行中心化,使得样本的均值中心处于坐标原点。中心化后样本长这样 ?????????那么通过上面的运算我们也就得到了协方差矩阵针对上面的样本,协方差矩阵大概长这个样子: ????????无论是从上面的矩阵看还是从协方差的性质上分析都能得出矩阵是对称矩阵,根据对称矩阵的性质我们可以得知其对角化公式为: ????????把上面的协方差矩阵公式代进来,再稍微变换一下就可以得到: ????????为了后期方便解读与表示,这里规定特征向量矩阵为单位化矩阵。 ????????我们先将上面所用例子的数值贴出来,再对公式进行解读。 , ????????经乘变换后的样本形式如图所示 ?????????从公式中可以解读出以下几点:
??????????到这里其实一切都可以揭秘了,生成样本的matlab的函数为:
?????????即生成了均值为5和10,方差为5和3的1000个独立高斯分布样本,也就是生成样本满足: ????????再对分布的坐标进行旋转使其产生带有协方差的样本。 ? ? ? ? 注意这里讲的是生成的方法,上面分析第4条讲的是对已经生成的的变换,不要混淆。? ????????实际上我们发现计算得出的其对角线上的元素正好是旋转前的两个独立分布的方差,这种情况只是一种巧合,因为我们只使用了旋转变换,并不改变样本点间的距离,若是更具有一般性的仿射变换则就不会有那么幸运了。 ?????????在这里, ????????虽然生成时采用了相同的分布,但是对生成样本进行了不同的变换,其得出的对角化方差也不同,但尽管如此,结合图示,我们依然可以得出结论,使用协方差矩阵的特征向量对统计样本进行变换,可以消除联合分布的关系,使得不同维度样本独立。 ????????进一步分析还可知,若如图4(a)那样对x1轴和x2轴进行投影求方差,只能求得协方差矩阵的对角元素,即21.5495和12.4563,而协方差-6.2597被忽略,这造成了“信息的浪费”。而对样本进行变换后再对x1轴和x2轴进行投影求方差,便可得到“最大化的方差信息”,这也是PCA(主成分分析)的核心思想,当然上述从信息量角度进行分析并不严谨,详细的证明可以参考PCA的证明方法。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 10:55:28- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |