| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【李航】统计学习方法--15. 奇异值分解(详细推导) -> 正文阅读 |
|
[人工智能]【李航】统计学习方法--15. 奇异值分解(详细推导) |
文章目录
15.1 奇异值分解的定义与性质15.1.1 定义与定理定义 15.1 15.1 15.1 (奇异值分解) 矩阵的奇异值分解是指, 将一个非零的 m × n m \times n m×n 实矩阵 A A A, A ∈ R m × n A \in \mathbf{R}^{m \times n} A∈Rm×n, 表示为以下三个实矩阵乘积形式的运算 , 即进行矩阵的因子分解: A = U Σ V T A=U \Sigma V^{\mathrm{T}} A=UΣVT 其中 U U U 是 m m m 阶正交矩阵 ( orthogonal matrix ), V V V 是 n n n 阶正交矩阵, Σ \Sigma Σ 是由降序排列的非负的对角线元素组成的 m × n m \times n m×n 矩形对角矩阵 ( rectangular diagonal matrix ), 满足 U U T = I V V T = I Σ = diag ? ( σ 1 , σ 2 , ? ? , σ p ) σ 1 ? σ 2 ? ? ? σ p ? 0 p = min ? ( m , n ) \begin{array}{l} U U^{\mathrm{T}}=I \\ V V^{\mathrm{T}}=I \\ \Sigma=\operatorname{diag}\left(\sigma_{1}, \sigma_{2}, \cdots, \sigma_{p}\right) \\ \sigma_{1} \geqslant \sigma_{2} \geqslant \cdots \geqslant \sigma_{p} \geqslant 0 \\ p=\min (m, n) \end{array} UUT=IVVT=IΣ=diag(σ1?,σ2?,?,σp?)σ1??σ2????σp??0p=min(m,n)?
U
Σ
V
T
U \Sigma V^{\mathrm{T}}
UΣVT 称为矩阵
A
A
A 的奇异值分解( singular value decomposition,
S
V
D
)
,
σ
i
\left.\mathrm{SVD}\right), \sigma_{i}
SVD),σi? 称为矩阵
A
A
A 的奇异值 ( singular value ),
U
U
U 的列向量称为左奇异向量 ( left singular vector ),
V
V
V
定理
15.1
15.1
15.1 (奇异值分解基本定理) 若
A
A
A 为一
m
×
n
m \times n
m×n 实矩阵,
A
∈
R
m
×
n
A \in \mathbf{R}^{m \times n}
A∈Rm×n, 则
A
A
A A = U Σ V T A=U \Sigma V^{\mathrm{T}} A=UΣVT 其中 U U U 是 m m m 阶正交矩阵, V V V 是 n n n 阶正交矩阵, Σ \Sigma Σ 是 m × n m \times n m×n 矩形对角矩阵, 其对角线 元素非负,且按降序排列。
15.1.2 紧奇异值分解与截断奇异值分解
15.1.3 几何解释任意一个向量 x ∈ R n x \in \mathbf{R}^{n} x∈Rn, 经过基于 A = U Σ V T A=U \Sigma V^{\mathrm{T}} A=UΣVT 的线性变换,等价于经过坐标系 的旋转或反射变换 V T V^{\mathrm{T}} VT, 坐标轴的缩放变换 Σ \Sigma Σ, 以及坐标系的旋转或反射变换 U U U, 得 到向量 A x ∈ R m A x \in \mathbf{R}^{m} Ax∈Rm 。 15.1.4 主要性质
15.2 奇异值分解的计算矩阵奇异值分解的计算过程
15.3 奇异值分解与矩阵近似15.3.1 弗罗贝尼乌斯范数定义 15.4 15.4 15.4 (弗罗贝尼乌斯范数) 设矩阵 A ∈ R m × n , A = [ a i j ] m × n A \in \mathbf{R}^{m \times n}, A=\left[a_{i j}\right]_{m \times n} A∈Rm×n,A=[aij?]m×n?, 定义矩阵 A A A 的弗罗贝尼乌斯范数为 ∥ A ∥ F = ( ∑ i = 1 m ∑ j = 1 n ( a i j ) 2 ) 1 2 \|A\|_{F}=\left(\sum_{i=1}^{m} \sum_{j=1}^{n}\left(a_{i j}\right)^{2}\right)^{\frac{1}{2}} ∥A∥F?=(i=1∑m?j=1∑n?(aij?)2)21? 引理
15.1
15.1
15.1 设矩阵
A
∈
R
m
×
n
,
A
A \in \mathbf{R}^{m \times n}, A
A∈Rm×n,A 的奇异值分解为
U
Σ
V
T
U \Sigma V^{\mathrm{T}}
UΣVT, 其中
Σ
=
diag
?
(
σ
1
,
\Sigma=\operatorname{diag}\left(\sigma_{1},\right.
Σ=diag(σ1?,, ∥ A ∥ F = ( σ 1 2 + σ 2 2 + ? + σ n 2 ) 1 2 \|A\|_{F}=\left(\sigma_{1}^{2}+\sigma_{2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}} ∥A∥F?=(σ12?+σ22?+?+σn2?)21? 证明 一般地, 若 Q Q Q 是 m m m 阶正交矩阵, 则有 ∥ Q A ∥ F = ∥ A ∥ F \|Q A\|_{F}=\|A\|_{F} ∥QA∥F?=∥A∥F? 因为 ∥ Q A ∥ F 2 = ∥ ( Q a 1 , Q a 2 , ? ? , Q a n ) ∥ F 2 = ∑ i = 1 n ∥ Q a i ∥ 2 2 = ∑ i = 1 n ( Q a i ) T Q a i = ∑ i = 1 n a i T Q T Q a i = ∑ i = 1 n ∥ a i ∥ 2 2 = ∥ A ∥ F 2 \begin{aligned} \|Q A\|_{F}^{2} &=\left\|\left(Q a_{1}, Q a_{2}, \cdots, Q a_{n}\right)\right\|_{F}^{2} \\ &=\sum_{i=1}^{n}\left\|Q a_{i}\right\|_{2}^{2}=\sum_{i=1}^{n}(Q a_{i})^TQ a_{i}=\sum_{i=1}^{n}a_{i}^TQ^TQ a_{i}=\sum_{i=1}^{n}\left\|a_{i}\right\|_{2}^{2}=\|A\|_{F}^{2} \end{aligned} ∥QA∥F2??=∥(Qa1?,Qa2?,?,Qan?)∥F2?=i=1∑n?∥Qai?∥22?=i=1∑n?(Qai?)TQai?=i=1∑n?aiT?QTQai?=i=1∑n?∥ai?∥22?=∥A∥F2?? 同样, 若 P P P 是 n n n 阶正交矩阵, 则有 ∥ A P T ∥ F = ∥ A ∥ F \left\|A P^{\mathrm{T}}\right\|_{F}=\|A\|_{F} ∥∥?APT∥∥?F?=∥A∥F? 故 ∥ A ∥ F = ∥ U Σ V T ∥ F = ∥ Σ ∥ F \|A\|_{F}=\left\|U \Sigma V^{\mathrm{T}}\right\|_{F}=\|\Sigma\|_{F} ∥A∥F?=∥∥?UΣVT∥∥?F?=∥Σ∥F? 即 ∥ A ∥ F = ( σ 1 2 + σ 2 2 + ? + σ n 2 ) 1 2 \|A\|_{F}=\left(\sigma_{1}^{2}+\sigma_{2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}} ∥A∥F?=(σ12?+σ22?+?+σn2?)21? 15.3.2 矩阵的最优近似定理
15.2
15.2
15.2 设矩阵
A
∈
R
m
×
n
A \in \mathbf{R}^{m \times n}
A∈Rm×n, 矩阵的秩
rank
?
(
A
)
=
r
\operatorname{rank}(A)=r
rank(A)=r, 并设
M
\mathcal{M}
M 为
R
m
×
n
\mathbf{R}^{m \times n}
Rm×n 中所 ∥ A ? X ∥ F = min ? S ∈ M ∥ A ? S ∥ F \|A-X\|_{F}=\min _{S \in \mathcal{M}}\|A-S\|_{F} ∥A?X∥F?=S∈Mmin?∥A?S∥F? 称矩阵 X X X 为矩阵 A A A 在弗罗贝尼乌斯范数意义下的最优近似。 定理 15.3 15.3 15.3 设矩阵 A ∈ R m × n A \in \mathbf{R}^{m \times n} A∈Rm×n, 矩阵的秩 rank ? ( A ) = r \operatorname{rank}(A)=r rank(A)=r, 有奇异值分解 A = A= A= U Σ V T U \Sigma V^{\mathrm{T}} UΣVT, 并设 M \mathcal{M} M 为 R m × n \mathrm{R}^{m \times n} Rm×n 中所有秩不超过 k k k 的矩阵的集合, 0 < k < r 0<k<r 0<k<r, 若秩为 k k k 的 矩阵 X ∈ M X \in \mathcal{M} X∈M 满足 ∥ A ? X ∥ F = min ? S ∈ M ∥ A ? S ∥ F ② \|A-X\|_{F}=\min _{S \in \mathcal{M}}\|A-S\|_{F}② ∥A?X∥F?=S∈Mmin?∥A?S∥F?② 则 ∥ A ? X ∥ F = ( σ k + 1 2 + σ k + 2 2 + ? + σ n 2 ) 1 2 ① \|A-X\|_{F}=\left(\sigma_{k+1}^{2}+\sigma_{k+2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}}① ∥A?X∥F?=(σk+12?+σk+22?+?+σn2?)21?① 特别地, 若 A ′ = U Σ ′ V T A^{\prime}=U \Sigma^{\prime} V^{\mathrm{T}} A′=UΣ′VT, 其中 Σ ′ = [ σ 1 ? 0 σ k 0 0 ? 0 ] = [ Σ k 0 0 0 ] \Sigma^{\prime}=\left[\begin{array}{ccccc} \sigma_{1} & & & & \\ & \ddots & & & 0 & \\ & & \sigma_{k} & & & \\ & & & 0 & & \\ & 0 & & & \ddots & \\ & & & & & 0 \end{array}\right]=\left[\begin{array}{cc} \Sigma_{k} & 0 \\ 0 & 0 \end{array}\right] Σ′=?????????σ1???0?σk??0?0??0??????????=[Σk?0?00?]
则 ∥ A ? A ′ ∥ F = ( σ k + 1 2 + σ k + 2 2 + ? + σ n 2 ) 1 2 = min ? S ∈ M ∥ A ? S ∥ F \left\|A-A^{\prime}\right\|_{F}=\left(\sigma_{k+1}^{2}+\sigma_{k+2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}}=\min _{S \in \mathcal{M}}\|A-S\|_{F} ∥A?A′∥F?=(σk+12?+σk+22?+?+σn2?)21?=S∈Mmin?∥A?S∥F? 证明 令 X ∈ M X \in \mathcal{M} X∈M 为满足式 ② ② ② 的一个矩阵。由于 ∥ A ? X ∥ F ? ∥ A ? A ′ ∥ F = ( σ k + 1 2 + σ k + 2 2 + ? + σ n 2 ) 1 2 ③ \|A-X\|_{F} \leqslant\left\|A-A^{\prime}\right\|_{F}=\left(\sigma_{k+1}^{2}+\sigma_{k+2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}}③ ∥A?X∥F??∥A?A′∥F?=(σk+12?+σk+22?+?+σn2?)21?③ 下面证明 ∥ A ? X ∥ F ? ( σ k + 1 2 + σ k + 2 2 + ? + σ n 2 ) 1 2 \|A-X\|_{F} \geqslant\left(\sigma_{k+1}^{2}+\sigma_{k+2}^{2}+\cdots+\sigma_{n}^{2}\right)^{\frac{1}{2}} ∥A?X∥F??(σk+12?+σk+22?+?+σn2?)21? 于是式 ①成立。
15.3.3 矩阵的外积展开式下面介绍利用外积展开式对矩阵 A A A 的近似。矩阵 A A A 的奇异值分解 U Σ V T U \Sigma V^{\mathrm{T}} UΣVT 也可以 由外积形式表示。事实上, 若将 A A A 的奇异值分解看成矩阵 U Σ U \Sigma UΣ 和 V T V^{\mathrm{T}} VT 的乘积, 将 U Σ U \Sigma UΣ 按列向量分块, 将 V T V^{\mathrm{T}} VT 按行向量分块, 即得 U Σ = [ σ 1 u 1 σ 2 u 2 ? σ n u n ] V T = [ v 1 T v 2 T ? v n T ] \begin{gathered} U \Sigma=\left[\begin{array}{llll} \sigma_{1} u_{1} & \sigma_{2} u_{2} & \cdots & \sigma_{n} u_{n} \end{array}\right] \\ V^{\mathrm{T}}=\left[\begin{array}{c} v_{1}^{\mathrm{T}} \\ v_{2}^{\mathrm{T}} \\ \vdots \\ v_{n}^{\mathrm{T}} \end{array}\right] \end{gathered} UΣ=[σ1?u1??σ2?u2????σn?un??]VT=??????v1T?v2T??vnT????????? 则 A = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ? + σ n u n v n T A=\sigma_{1} u_{1} v_{1}^{\mathrm{T}}+\sigma_{2} u_{2} v_{2}^{\mathrm{T}}+\cdots+\sigma_{n} u_{n} v_{n}^{\mathrm{T}} A=σ1?u1?v1T?+σ2?u2?v2T?+?+σn?un?vnT? 上式称为矩阵 A A A 的外积展开式, 其中 u k v k T u_{k} v_{k}^{\mathrm{T}} uk?vkT? 为 m × n m \times n m×n 矩阵, 是列向量 u k u_{k} uk? 和行 向量 v k T v_{k}^{\mathrm{T}} vkT? 的外积, 其第 i i i 行第 j j j 列元素为 u k u_{k} uk? 的第 i i i 个元素与 v k T v_{k}^{\mathrm{T}} vkT? 的第 j j j 个元素的乘积。即 u i v j T = [ u 1 i u 2 i ? u m i ] [ v 1 j v 2 j ? v n j ] = [ u 1 i v 1 j u 1 i v 2 j ? u 1 i v n j u 2 i v 1 j u 2 i v 2 j ? u 2 i v n j ? ? ? u m i v 1 j u m i v 2 j ? u m i v n j ] u_{i} v_{j}^{\mathrm{T}}=\left[\begin{array}{c} u_{1 i} \\ u_{2 i} \\ \vdots \\ u_{m i} \end{array}\right]\left[\begin{array}{llll} v_{1 j} & v_{2 j} & \cdots & v_{n j} \end{array}\right]=\left[\begin{array}{cccc} u_{1 i} v_{1 j} & u_{1 i} v_{2 j} & \cdots & u_{1 i} v_{n j} \\ u_{2 i} v_{1 j} & u_{2 i} v_{2 j} & \cdots & u_{2 i} v_{n j} \\ \vdots & \vdots & & \vdots \\ u_{m i} v_{1 j} & u_{m i} v_{2 j} & \cdots & u_{m i} v_{n j} \end{array}\right] ui?vjT?=??????u1i?u2i??umi????????[v1j??v2j????vnj??]=??????u1i?v1j?u2i?v1j??umi?v1j??u1i?v2j?u2i?v2j??umi?v2j??????u1i?vnj?u2i?vnj??umi?vnj???????? A A A 的外积展开式也可以写成下面的形式 A = ∑ k = 1 n A k = ∑ k = 1 n σ k u k v k T A=\sum_{k=1}^{n} A_{k}=\sum_{k=1}^{n} \sigma_{k} u_{k} v_{k}^{\mathrm{T}} A=k=1∑n?Ak?=k=1∑n?σk?uk?vkT? 其中
A
k
=
σ
k
u
k
v
k
T
A_{k}=\sigma_{k} u_{k} v_{k}^{\mathrm{T}}
Ak?=σk?uk?vkT? 是
m
×
n
m \times n
m×n 矩阵。上式将矩阵
A
A
A 分解为矩阵的有序加权和。 A = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ? + σ n u n v n T A=\sigma_{1} u_{1} v_{1}^{\mathrm{T}}+\sigma_{2} u_{2} v_{2}^{\mathrm{T}}+\cdots+\sigma_{n} u_{n} v_{n}^{\mathrm{T}} A=σ1?u1?v1T?+σ2?u2?v2T?+?+σn?un?vnT? 设矩阵 A n ? 1 = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ? + σ n ? 1 u n ? 1 v n ? 1 T A_{n-1}=\sigma_{1} u_{1} v_{1}^{\mathrm{T}}+\sigma_{2} u_{2} v_{2}^{\mathrm{T}}+\cdots+\sigma_{n-1} u_{n-1} v_{n-1}^{\mathrm{T}} An?1?=σ1?u1?v1T?+σ2?u2?v2T?+?+σn?1?un?1?vn?1T? 则
A
n
?
1
A_{n-1}
An?1? 的秩为
n
?
1
n-1
n?1, 并且
A
n
?
1
A_{n-1}
An?1? 是秩为
n
?
1
n-1
n?1 矩阵在弗罗贝尼乌斯范数意义下
A
A
A 的 最优近似矩阵。 A n ? 2 = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ? + σ n ? 2 u n ? 2 v n ? 2 T A_{n-2}=\sigma_{1} u_{1} v_{1}^{\mathrm{T}}+\sigma_{2} u_{2} v_{2}^{\mathrm{T}}+\cdots+\sigma_{n-2} u_{n-2} v_{n-2}^{\mathrm{T}} An?2?=σ1?u1?v1T?+σ2?u2?v2T?+?+σn?2?un?2?vn?2T? 则 A n ? 2 A_{n-2} An?2? 的秩为 n ? 2 n-2 n?2, 并且 A n ? 2 A_{n-2} An?2? 是秩为 n ? 2 n-2 n?2 矩阵中在弗罗贝尼乌斯范数意义下 A A A 的最优近似矩阵。以此类推。一般地,设矩阵 A k = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ? + σ k u k v k T A_{k}=\sigma_{1} u_{1} v_{1}^{\mathrm{T}}+\sigma_{2} u_{2} v_{2}^{\mathrm{T}}+\cdots+\sigma_{k} u_{k} v_{k}^{\mathrm{T}} Ak?=σ1?u1?v1T?+σ2?u2?v2T?+?+σk?uk?vkT? 则
A
k
A_{k}
Ak? 的秩为
k
k
k, 并且
A
k
A_{k}
Ak? 是秩为
k
k
k 的矩阵中在弗罗贝尼乌斯范数意义下
A
A
A 的最优近 似矩阵。矩阵
A
k
A_{k}
Ak? 就是
A
A
A 的截断奇异值分解。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 16:41:13- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |