IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 对机器学习中的协方差矩阵还是傻傻的搞不清楚?这次我终于捋明白了! -> 正文阅读

[人工智能]对机器学习中的协方差矩阵还是傻傻的搞不清楚?这次我终于捋明白了!

一、数学中协方差矩阵的前世今生

1、前世
(1)随机变量 X X X的2阶中心距: E E E{ [ X ? E ( X ) ] 2 [X-E(X)]^2 [X?E(X)]2}
(2)随机变量 X 和 Y X和Y XY的2阶混合中心距: E E E{ [ X ? E ( X ) ] [ Y ? E ( Y ) ] [X-E(X)][Y-E(Y)] [X?E(X)][Y?E(Y)]}
2、今生
协方差矩阵由2阶中心距和2阶混合中心距共同定义。
(1)二维变量的协方差矩阵
设二维随机变量( X 1 , X 2 X_1,X_2 X1?,X2?),可得到四个2阶中心距,分别为:
c 11 c_{11} c11?= E E E{ [ X 1 ? E ( X 1 ) ] 2 [X_1-E(X_1)]^2 [X1??E(X1?)]2}
c 12 c_{12} c12?= E E E{ [ X 1 ? E ( X 1 ) ] [ X 2 ? E ( X 2 ) ] [X_1-E(X_1)][X_2-E(X_2)] [X1??E(X1?)][X2??E(X2?)]}
c 21 c_{21} c21?= E E E{ [ X 2 ? E ( X 2 ) ] [ X 1 ? E ( X 1 ) ] [X_2-E(X_2)][X_1-E(X_1)] [X2??E(X2?)][X1??E(X1?)]}
c 22 c_{22} c22?= E E E{ [ X 2 ? E ( X 2 ) ] 2 [X_2-E(X_2)]^2 [X2??E(X2?)]2}
c 11 c_{11} c11? c 12 c_{12} c12? c 21 c_{21} c21? c 22 c_{22} c22?共同组成的矩阵 C C C,称为二维随机变量( X 1 , X 2 X_1,X_2 X1?,X2?)的协方差矩阵。 C C C的形式如下:
C = ( c 11 c 12 c 21 c 22 ) C=\left( \begin{matrix} c_{11}& c_{12} \\ c_{21}& c_{22} \end{matrix} \right) C=(c11?c21??c12?c22??)
(2) n n n维协方差矩阵
将二维随机变量的协方差矩阵进行推广,设 n n n维随机变量( X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1?,X2?,...,Xn?),可得到 n × n n×n n×n个2阶中心距 c i j c_{ij} cij?= E E E{ [ X i ? E ( X i ) ] [ X j ? E ( X j ) ] [X_i-E(X_i)][X_j-E(X_j)] [Xi??E(Xi?)][Xj??E(Xj?)]},其中 i , j = 1 , 2 , . . . , n i,j=1,2,...,n i,j=1,2,...,n,则称矩阵
C = ( c 11 c 12 ? c 1 n c 21 c 22 ? c 2 n ? ? ? ? c n 1 c n 2 ? c n n ) C=\left( \begin{matrix} c_{11}& c_{12} & \cdots &c_{1n} \\ c_{21}& c_{22}& \cdots &c_{2n} \\ \vdots& \vdots& \cdots &\vdots \\ c_{n1}& c_{n2}& \cdots &c_{nn} \end{matrix} \right) C=??????c11?c21??cn1??c12?c22??cn2???????c1n?c2n??cnn????????
n n n维随机变量( X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1?,X2?,...,Xn?)的协方差矩阵。
由于 c i j = c j i c_{ij}=c_{ji} cij?=cji?,显然,协方差矩阵是一个对称矩阵。

二、机器学习中的协方差矩阵

机器学习中模型的训练需要大量样本,在计算协方差矩阵时,一般先将样本拼成一个 d × N d×N d×N维的矩阵 X X X={ x 1 , x 2 , . . . , x N x_1,x_2,...,x_N x1?,x2?,...,xN?},其中 d d d为样本的维数, N N N为样本的个数, x k x _k xk?表示一个样本。
计算样本均值 x 0 = 1 N ∑ i = k N x k x_0=\displaystyle\frac{1}{N}\sum_{i=k}^Nx_k x0?=N1?i=kN?xk?后,可得到 d d d维样本的协方差矩阵: Σ X = 1 N ∑ i = k N ( x k ? x 0 ) ( x k ? x 0 ) T \Sigma_X=\displaystyle\frac{1}{N}\sum_{i=k}^N(x_k-x_0)(x_k-x_0)^T ΣX?=N1?i=kN?(xk??x0?)(xk??x0?)T
举例:
对于由5个样本组成的一个二维数据 X = ( ? 1 ? 1 0 2 0 ? 2 0 0 1 1 ) X=\left( \begin{matrix} -1& -1 & 0&2 &0\\ -2& 0& 0 &1 &1 \end{matrix} \right) X=(?1?2??10?00?21?01?)
显然,在这里 x 1 = ( ? 1 ? 2 ) , x 2 = ( ? 1 0 ) , x 3 = ( 0 0 ) , x 4 = ( 2 1 ) , x 5 = ( 0 1 ) , 从 而 有 x 0 = ( 0 0 ) x_1=\left( \begin{matrix} -1\\ -2 \end{matrix} \right),x_2=\left( \begin{matrix} -1\\ 0 \end{matrix} \right),x_3=\left( \begin{matrix} 0\\ 0 \end{matrix} \right),x_4=\left( \begin{matrix} 2\\ 1 \end{matrix} \right),x_5=\left( \begin{matrix} 0\\ 1 \end{matrix} \right),从而有x_0=\left( \begin{matrix} 0\\ 0 \end{matrix} \right) x1?=(?1?2?),x2?=(?10?),x3?=(00?),x4?=(21?),x5?=(01?),x0?=(00?)
进一步求出该二维数据的协方差矩阵
在这里插入图片描述
通过以上计算过程可以看出,每个样本的计算过程都与数学中协方差矩阵的定义保持一致,eg:过程①,也即是说机器学习中协方差矩阵的计算和数学中协方差矩阵的定义保持一致。
事实上,以上计算过程等价于 C = 1 5 X X T = 1 5 ( ? 1 ? 1 0 2 0 ? 2 0 0 1 1 ) ( ? 1 ? 2 ? 1 0 0 0 2 1 0 1 ) = ( 6 5 4 5 4 5 6 5 ) C=\displaystyle\frac{1}{5}XX^T=\frac{1}{5}\left( \begin{matrix} -1& -1 & 0&2 &0\\ -2& 0& 0 &1 &1 \end{matrix} \right)\left( \begin{matrix} -1& -2\\ -1& 0\\ 0& 0\\ 2& 1\\ 0& 1 \end{matrix} \right)=\left( \begin{matrix} \displaystyle\frac{6}{5} & & \displaystyle\frac{4}{5}\\ & & \\ \displaystyle\frac{4}{5}& & \displaystyle\frac{6}{5} \end{matrix} \right) C=51?XXT=51?(?1?2??10?00?21?01?)????????1?1020??20011????????=?????56?54???54?56???????
总结:
机器学习中协方差矩阵的快速计算公式为:
C = 1 N X X T C=\displaystyle\frac{1}{N}XX^T C=N1?XXT
其中, N N N为样本个数, X X X为大量样本拼成的 d × N d×N d×N维矩阵。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-16 19:38:58  更:2021-10-16 19:39:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 10:28:03-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码