IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 主成分分析(PCA)及动态主成分分析(Dynamic PCA)模型原理分析 -> 正文阅读

[人工智能]主成分分析(PCA)及动态主成分分析(Dynamic PCA)模型原理分析

纯理论推导,建议慢食!!!


建议推一遍公式,挺好的。

主成分分析(PCA Model, PM)

PCA是一种统计方法,广泛应用于工程和科学应用中,与傅里叶分析相比,尤其适用于质量监测。

x ∈ R m \boldsymbol{x} \in \mathfrak{R}^{m} xRm表示 m m m个传感器矢量的样本测量值。

假设每个传感器有 N N N个样本,数据矩阵 X = [ x 1 x 2 ? x N ] T ∈ R N × m \mathbf{X}=\left[\begin{array}{llll} \boldsymbol{x}_{1} & \boldsymbol{x}_{2} & \cdots & \boldsymbol{x}_{N} \end{array}\right]^{T} \in \mathfrak{R}^{N \times m} X=[x1??x2????xN??]TRN×m,由代表样本 x i T x^T_i xiT?的每一行组成。

正常数据矩阵 X X X的一个重要要求是,它应具有丰富的正常变化,以代表过程的共同原因变化。矩阵 X X X被缩放为零均值,通常为PCA建模的单位方差。矩阵 X X X通过奇异值分解(SVD)分解为得分矩阵 T T T加载矩阵 P P P
X = T P T + X ~ (1) \mathbf{X}=\mathbf{T P}^{T}+\tilde{\mathbf{X}}\tag{1} X=TPT+X~(1)

其中 T = X P T=XP T=XP包含 l l l 个左前导奇异向量和奇异值,P 包含 l l l个右前导奇异向量, X ~ \tilde{\mathbf{X}} X~ 是残差矩阵。因此,T 的列是正交的,P 的列是正交的。将样本协方差矩阵表示为
S = 1 N ? 1 X T X (2) \mathbf{S}=\frac{1}{N-1} \mathbf{X}^{T} \mathbf{X}\tag{2} S=N?11?XTX(2)

作为SVD的替代方法,可以对 S 进行特征分解,以获得 P 作为 S l l l 个前导特征向量,特征值表示为

Λ = diag ? { λ 1 , λ 2 , … , λ l } (3) \mathbf{\Lambda}=\operatorname{diag}\left\{\lambda_{1}, \lambda_{2}, \ldots, \lambda_{l}\right\}\tag{3} Λ=diag{λ1?,λ2?,,λl?}(3)
i i i 个特征值可与得分矩阵 T 的第 i i i 列相关,如下所示:
λ i = 1 N ? 1 t i T t i ≈ var ? { t i } (4) \lambda_{i}=\frac{1}{N-1} \mathbf{t}_{i}^{T} \mathbf{t}_{i} \approx \operatorname{var}\left\{\mathbf{t}_{i}\right\}\tag{4} λi?=N?11?tiT?ti?var{ti?}(4)

这是第 i i i个得分向量 t i ∈ R N \mathbf{t}_{i} \in \mathfrak{R}^{N} ti?RN的样本方差。主成分子空间(PCS)是 S p = span ? { P } \mathcal{S}_{p}=\operatorname{span}\{\mathbf{P}\} Sp?=span{P},剩余子空间(RS) S r S_r Sr? S p S_p Sp?的正交补。将测量空间划分为PCS和RS,使得RS仅包含微小的奇异值,这些奇异值对应于通常具有较小变化的子空间,或者主要是噪声的子空间。因此,残差类似于根据质量平衡和能量平衡建立的数学模型中的方程误差

样本向量 x ∈ R m \mathbf{x} \in \mathfrak{R}^{m} xRm可以分别投影到PCS和RS上,

x ^ = P t = P P T x ∈ S p (5) \hat{\boldsymbol{x}}=\mathbf{P} \boldsymbol{t}=\mathbf{P P}^{T} \boldsymbol{x} \in \mathcal{S}_{p}\tag{5} x^=Pt=PPTxSp?(5)

其中,

t = P T x ∈ R l (6) \boldsymbol{t}=\mathbf{P}^{T} \boldsymbol{x} \in \mathfrak{R}^{l}\tag{6} t=PTxRl(6)

l l l 个潜在变量得分的向量。

残差向量:

x ~ = x ? x ^ = ( I ? P P T ) x ∈ S r (7) \tilde{\boldsymbol{x}}=\boldsymbol{x}-\hat{\boldsymbol{x}}=\left(\mathbf{I}-\mathbf{P P}^{T}\right) \boldsymbol{x} \in \mathcal{S}_{r}\tag{7} x~=x?x^=(I?PPT)xSr?(7)

因为 S p S_p Sp? S r S_r Sr? 是正交的,

x ^ T x ~ = 0 (8) \hat{\boldsymbol{x}}^{T} \tilde{\boldsymbol{x}}=0\tag{8} x^Tx~=0(8)

x = x ^ + x ~ (9) \boldsymbol{x}=\hat{\boldsymbol{x}}+\tilde{\boldsymbol{x}}\tag{9} x=x^+x~(9)

其中,一个重要的概念是,数据的PCA模型, x ^ \hat{\boldsymbol{x}} x^由潜变量 t ∈ R m \mathbf{t} \in \mathfrak{R}^{m} tRm 参数化。

动态主成分分析(Dynamic PCA Models, DPM)

同样的PCA分解可以扩展到表示时间相关的动态过程数据,通过传递函数矩阵提取与测量向量相关的潜在变量。在潜变量建模中,测量变量不分为输入变量和输出变量。

相反,所有变量都与许多潜在变量相关,以表示它们的相关性。

z k z_k zk?时间 k k k时所有的变量的集合。

扩展变量向量可以定义为

x k T = [ z k T z k ? 1 T ? z k ? d T ] (9) \boldsymbol{x}_{k}^{T}=\left[\boldsymbol{z}_{k}^{T} \mathbf{z}_{k-1}^{T} \cdots \boldsymbol{z}_{k-d}^{T}\right]\tag{9} xkT?=[zkT?zk?1T??zk?dT?](9)

PCA潜在变量得分可根据(5)计算,如下所示:
t k = P T [ z k T z k ? 1 T ? z k ? d T ] T (10) \mathbf{t}_{k}=\mathbf{P}^{T}\left[\mathbf{z}_{k}^{T} \mathbf{z}_{k-1}^{T} \cdots \mathbf{z}_{k-d}^{T}\right]^{T}\tag{10} tk?=PT[zkT?zk?1T??zk?dT?]T(10)

根据(10)将 P P P划分为 d + 1 d+1 d+1

P T = [ P 0 T P 1 T ? P d T ] (11) \mathbf{P}^{T}=\left[\begin{array}{llll} \mathbf{P}_{0}^{T} & \mathbf{P}_{1}^{T} & \cdots & \mathbf{P}_{\mathrm{d}}^{T} \end{array}\right]\tag{11} PT=[P0T??P1T????PdT??](11)

由(10) 可以用传递矩阵的形式表示,
t k = ∑ i = 0 d P i T z k ? i ≡ A ( q ? 1 ) z k (12) \boldsymbol{t}_{k}=\sum_{i=0}^{d} \mathbf{P}_{i}^{T} \boldsymbol{z}_{k-i} \equiv A\left(q^{-1}\right) \boldsymbol{z}_{k}\tag{12} tk?=i=0d?PiT?zk?i?A(q?1)zk?(12)

其中, A ( q ? 1 ) = ∑ i = 0 d P i T q ? i A\left(q^{-1}\right)=\sum_{i=0}^{d} \mathbf{P}_{i}^{T} \boldsymbol{q}^{-i} A(q?1)=i=0d?PiT?q?i是矩阵多项式, q ? i \boldsymbol{q}^{-i} q?i是后移算子。等式(12)表明,潜在变量是过去数据的线性组合,其降序方差最大。这个概念类似于卡尔曼滤波器状态向量。投影(4)包含测量的滤波或平滑估计。

在闭环控制系统的情况下,过程输入和输出变量通常对一些主要的过程扰动作出响应。主要扰动起潜变量的作用。因此,潜在变量模型可以在向量 z k z_k zk?中包括过程输入和输出。

?坚持读Paper,坚持做笔记?!!!
To Be No.1


创作不易,过路能?关注收藏点个赞?三连就最好不过了

?( ′・?・` )


她有心,她的心在我这里

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-06 09:37:50  更:2021-08-06 09:44:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 14:51:20-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码