IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习中的数学——期望、方差和协方差 -> 正文阅读

[人工智能]机器学习中的数学——期望、方差和协方差

函数 f ( x ) f(x) f(x)关于某分布 P ( x ) P(x) P(x)的期望或者期望值是指,当 x x x P P P产生, f f f作用于 x x x时, f ( x ) f(x) f(x)的平均值。对于离散型随机变量,这可以通过求和得到:
E x ~ P [ f ( x ) ] = ∑ x f ( x ) P ( x ) E_{x \sim P}[f(x)] = \sum_x f(x) P(x) ExP?[f(x)]=x?f(x)P(x)

对于连续型随机变量可以通过求积分得到:
E x ~ p [ f ( x ) ] = ∫ x f ( x ) p ( x ) d x E_{x \sim p}[f(x)] = \int_x f(x)p(x)dx Exp?[f(x)]=x?f(x)p(x)dx

当概率分布在上下文中指明时,我们可以只写出期望作用的随机变量的名称来进行简化,例如囻 E x [ f ( x ) ] E_{x}[f(x)] Ex?[f(x)]。如果期望作用的随机变量也很明确,我们可以完全不写脚标,就像 E [ f ( x ) ] E[f(x)] E[f(x)]。默认地,我们假设 [ ? ] [\cdot] [?]表示对方括号内的所有随机变量的值求平均。类似的,当没有歧义时,我们还可以省略方括号。

期望是线性的,例如:
E x [ α f ( x ) + β g ( x ) ] = α E x [ f ( x ) ] + β E x [ g ( x ) ] E_{x}[\alpha f(x)+\beta g(x)]=\alpha E_{x}[f(x)]+\beta E_{x}[g(x)] Ex?[αf(x)+βg(x)]=αEx?[f(x)]+βEx?[g(x)]

其中 = α =\alpha =α β \beta β不依赖于 x x x

方差( variance)衡量的是当我们对x依据它的概率分布进行采样时,随机变量ⅹ的函数值会呈现多大的差异:
V a r [ f ( x ) ] = E [ ( f ( x ) ? E [ f ( x ) ] ) 2 ] . \mathrm{Var}[f(x)] = E\left[\left(f(x) - E[f(x)]\right)^2\right]. Var[f(x)]=E[(f(x)?E[f(x)])2].

当方差很小时, f ( x ) f(x) f(x)的值形成的簇比较接近它们的期望值。方差的平方根被称为标准差。

协方差在某种意义上给出了两个变量线性相关性的强度以及这些变量的尺度:
C o v ( f ( x ) , g ( y ) ) = E [ ( f ( x ) ? E [ f ( x ) ] ) ( g ( y ) ? E ( g ( y ) ) ) ] Cov(f(x), g(y))=E[(f(x)-E[f(x)])(g(y)-E(g(y)))] Cov(f(x),g(y))=E[(f(x)?E[f(x)])(g(y)?E(g(y)))]

协方差的绝对值如果很大则意味着变量值变化很大并且它们同时距离各自的均值很远。如果协方差是正的,那么两个变量都倾向于同时取得相对较大的值。如果协方差是负的,那么其中一个变量倾向于取得相对较大的值的同时,另一个变量倾向于取得相对较小的值,反之亦然。其他的衡量指标如相关系数将每个变量的贡献归一化,为了只衡量变量的相关性而不受各个变量尺度大小的影响。

协方差和相关性是有联系的,但实际上是不同的概念。它们是有联系的,因为两个变量如果相互独立那么它们的协方差为零,如果两个变量的协方差不为零那么它们一定是相关的。然而,独立性又是和协方差完全不同的性质。两个变量如果协方差为零,它们之间一定没有线性关系。独立性比零协方差的要求更强,因为独立性还排除了非线性的关系。两个变量相互依赖但具有零协方差是可能的。例如,假设我们首先从区间 [ ? 1 , 1 ] [-1, 1] [?1,1]上的均匀分布中采样出一个实数 x x x。然后我们对一个随机变量 s s s进行采样。 s s s 1 2 \frac{1}{2} 21?的概率值为1,否则为-1。我们可以通过令 y = s x y=sx y=sx来生成个随机变量 y y y。显然, x x x y 不 y不 y是相互独立的,因为 x x x完全决定了 y y y的尺度。然而, C o v ( x , y ) = 0 Cov(x, y)=0 Cov(x,y)=0

随机向量 x ∈ R n x\in R^n xRn的协方差矩阵是一个 n × n n\times n n×n的矩阵,并且满足:
C o v ( x ) i , j = C o v ( x i , x j ) Cov(x)_{i, j}=Cov(x_i, x_j) Cov(x)i,j?=Cov(xi?,xj?)

协方差矩阵的对角元是方差:
C o v ( x ) i , i = V a r ( x i ) Cov(x)_{i, i}=Var(x_i) Cov(x)i,i?=Var(xi?)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-03 17:04:52  更:2021-10-03 17:06:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 12:38:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码