开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 数据结构与算法 -> 凸优化笔记 -> 正文阅读

[数据结构与算法]凸优化笔记

简单凸优化笔记

凸函数和凸集

凸函数上方区域为凸集
函数上方区域为凸集，则函数为凸函数

凸集

集合 $C$ 任意两点间线段都在集合 $C$ 里，则称集合 $C$ 为凸集
$\forall x_{1},x_{2}\in C, \theta\in[0,1]\\ 则\theta x_{1}+(1-\theta)x_{2}\in C$
拓展
$\forall x_{1},...,x_{k}\in C, \theta_{i}\in[0,1]且\sum\theta_{i}=1\\ 则\sum\theta_{i}x_{i}\in C$
在这里插入图片描述

凸多边形是凸集,边界缺失不是凸集

超平面和半空间

超平面

${x|a^{T}x=b\}$

半空间

$\{x|a^{T}x\leq b\}\\ \{x|a^{T}x\geq b\}$

在这里插入图片描述

多面体

多面体是有限个半空间和超平面交集
$P=\{x|a_{j}^{T}x\leq b_{j},c_{i}^{T}x=d_{i}\}$
仿射集（如超平面，直线），射线，线段，半空间都是多面体

多面体是凸集

有界多面体称多胞形

在这里插入图片描述

保持凸性运算

集合交运算

在这里插入图片描述

定义证明

仿射变换
- 伸缩
- 平移
- 投影

$f(x)=Ax+b,A\in R^{m\times n},b\in R^{m}\\ f:R^{n}\rightarrow R^{m} \quad f(S)=\{f(x)|x\in S\}\\ S为凸集\rightarrow f(S)为凸集\\ f(S)为凸集\rightarrow S为凸集\\$

透视变换

透视函数对向量进行伸缩（规范）使最后一维的分量为一并舍弃
$P:R^{n+1}\rightarrow R^{n}, P(z,t)=z/t$
在这里插入图片描述

投射变换（线性分式变换）

透视和仿射的复合
$g:R^{n}\rightarrow R^{n+1}\\ g(x)=\begin{bmatrix} A\\ c^{T} \end{bmatrix}x+ \begin{bmatrix} b \\ d \end{bmatrix}\\ A\in R^{m\times n},b\in R^{m},c\in R^{n},d\in R$
定义 $f$ 为线性分式函数
$f(x)=\frac{(Ax+b)}{c^{T}x+d}\\ dom f=\{x|c^{T}x+d>0\}$
若 $c = 0, d > 0$ 则 $f$ 为普通仿射函数

分割超平面

设 $C$ 和 $D$ 为两个不相交凸集，则存在超平面 $P$ ， $P$ 可以将 $C$ 和 $D$ 分离
$\forall x\in C,a^{T}x\leq b且\forall x\in D,a^{T}x\geq b$

注意可以取等号

在这里插入图片描述

逆命题

若两个凸集 $C$ 和 $D$ 的分割超平面存在， $C$ 和 $D$ 不相交为假命题

加强条件

若两个凸集至少有一个是开集，那么当且仅当存在分割超平面，它们不相交

分割超平面构造

距离

两个集合距离为两个集合间元素的最短距离

构造

做距离中垂线

支撑超平面

设集合 $C$ ， $x_{0}$ 为 $C$ 边界上的点。若存在 $a\neq 0$ ，满足对任意 $x\in C$ ，都有 $a^{T}x\leq a^{T}x_{0}$ 成立，则称超平面 ${x|a^{T}x=a^{T}x_{0}\}$ 为集合 $C$ 在点 $x_{0}$ 处的支撑超平面

凸集边界任意一点都存在支撑超平面

反之，若一个闭的非中空（内部点不为空）集合，在边界上任意一点存在支撑超平面，则该集合为凸集

凸函数

若函数 $f$ 定义域 $d o m f$ 为凸集，且满足
$\forall x,y\in domf,0\leq\theta\leq1有 f(\theta x+(1-\theta)y)\leq \theta f(\theta)+(1-\theta)f(y)$
在这里插入图片描述

一阶可微

若 $f$ 一阶可微，则函数 $f$ 为凸函数当且仅当 $f$ 的定义域 $d o m f$ 为凸集且
$\forall x,y\in dom f,f(y)\geq f(x)+\bigtriangledown f(x)^{T}(y-x)$
在这里插入图片描述

对于凸函数，其一阶泰勒近似本质为该函数全局估计

反之若一个函数一阶泰勒近似总是其全局下估计，则该函数为凸函数

二阶可微

若函数 $f$ 二阶可微，则函数 $f$ 为凸函数当且仅当 $d o m f$ 为凸集，且
$\bigtriangledown^{2}f(x)\succ =0$
若 $f$ 为一元函数，上式表示二阶导大于等于 $0$

若 $f$ 为多元函数，上式表示二阶导海森矩阵半正定

例子

$e^{ax}$
$x^{a},x\in R_{+},a\geq1或a\leq 0$
$? l o g x$
$x l o g x$
$x||_{p}$
- $max(x_{1},...,x_{n})$
- $x^{2}/a,a>0$
- $log(e^{x_{1}+...+e^{x_{n}}})$

上境图

在这里插入图片描述
函数 $f$ 图像定义为 $\{(x,f(x))|x\in dom f\}$
函数 $f$ 的上境图定义为
$epif=\{(x,t)|x\in domf,f(x)\leq t\}$

凸函数与凸集

一个函数是凸函数，当且仅当其上境图是凸集
一个函数为凹函数，当且仅当其亚图是凸集
$f=\{(x,t)|t\leq f(x)\}$

杰森不等式

$f$ 是凸函数情况下
$f(\theta x+(1-\theta)y)\leq\theta f(x)$
$若\theta_{1}...\theta_{k}\geq 0,\theta_{1}+...+\theta_{k}=1\\ 则f(\theta_{1}x_{1}+...+\theta_{k}x_{k})\leq\theta_{1}f(x_{1})+...+\theta_{k}f(x_{k})$
$若p(x)\geq 0 在S\subseteq domf,\int_{S}p(x)dx=1 \\ 则f(\int_{S}p(x)xdx)\leq \int_{S}f(x)p(x)dx\\ 或f(Ex)\leq E(f(x))$
可由杰森不等式证明
$D(p||q)=\sum p(x)log \frac{p(x)}{q(x)}=E_{p(x)}log\frac{p(x)}{q(x)}\geq 0$
等等

保持函数凸性的算子

非负加权和
$f(x)=w_{1}f_{1}(x)+...+w_{n}f_{n}(x)$
与仿射函数复合
$g (x) = f (A x + b)$
逐点最大值，逐点上确界
$f(x)=max(f_{1}(x),...,f_{n}(x))\\ f(x)=\sup_{y\in A}g(x,y)$

函数逐点上确界函数对应着函数上境图交集

凸优化

优化问题基本形式

$最小化f_{0}(x),x\in R^{n}\\ 不等式约束f_{i}(x)\leq 0,i=1...m\\ 等式约束h_{i}(x)=0,j=1...p\\ 无约束优化m=p=0$
$优化问题的域D=\bigcap_{i=1}^{m} domf_{i} \cap \bigcap_{j=1}^{p}domh_{j} \\ 可行点（解）x\in D 且满足约束条件\\ 可行域，所有可行点集合$
$最优化值p^{*}=inf\{f_{0}(x)|f_{i}(x)\leq0,i=1...m,h_{j}(x)=0,j=1...p\}\\ 最优化解p^{*}=f_{0}(x^{*})$

凸优化问题基本形式

$f_{i}(x)为凸函数\\ h_{j}(x)为仿射函数$
重要性质

可行域为凸集
局部最优解为全局最优解

对偶问题

拉格朗日函数

$L(x,\lambda,\upsilon)=f_{0}(x)+\sum \lambda_{i}f_{i}(x)+\sum\upsilon _{j}h_{j}(x)$
对固定 $x$ ，拉格朗日函数 $L(x,\lambda,\upsilon )$ 为关于 $\lambda$ 和 $\upsilon$ 的仿射函数

拉格朗日对偶函数

$g(\lambda,\upsilon)=\inf_{x\in D}L(x,\lambda,\upsilon)=\inf_{x\in D}(f_{0}(x)+\sum \lambda_{i}f_{i}(x)+\sum\upsilon _{j}h_{j}(x))\\ 若无下确界定义g(\lambda,\upsilon)=-\infty$
根据定义有：对 $\forall \lambda\geq 0,\forall\upsilon$ ，原优化问题有最优值 $p^{*}$ ，则
$g(\lambda,\upsilon)\leq p^{*}$
进一步，拉格朗日对偶函数为凹函数
在这里插入图片描述
假设 $x_{0}$ 不可行，即存在 $f_{i}(x)>0$ ，则选择 $\lambda_{i}\rightarrow\infty$ ，对于其他乘子 $\lambda_{i}=0,j\neq i$
假设 $x_{0}$ 可行，则有 $f_{i}(x)\leq 0,i=1...m$ ，令 $\lambda_{i}=0,i=1...m$
有
$\sup_{\lambda\geq 0}L(x,\lambda)=\sup_{\lambda\geq 0}(f_{0}(x)+\sum\lambda_{i}f_{i}(x))= \left\{\begin{matrix} f_{0}(x),f_{i}(x)<0 \\ \infty，other \end{matrix}\right.$

原问题为 $inf_{x} f_{0}(x)$ 转变为 $\inf_{x} \sup_{\lambda\geq 0}L(x,\lambda)$
对偶问题是求对偶函数最大值，即
$\sup_{\lambda\geq0}\inf_{x}L(x,\lambda)$
而
$\sup_{\lambda\geq0}\inf_{x}L(x,\lambda)\leq\inf_{x}\sup_{\lambda\geq0}L(x,\lambda)$

强对偶条件

对偶函数最大值为原问题最小值
$f_{0}(x^{*})=g(\lambda^{*}+\upsilon^{*})\\ =\inf_{x}(f_{0}(x)+\sum \lambda_{i}^{*}f_{i}(x)+\sum\upsilon _{j}^{*}h_{j}(x))\\ \leq f_{0}(x^{*})+\sum \lambda_{i}^{*}f_{i}(x^{x})+\sum\upsilon _{j}^{*}h_{j}(x^{*})\\ \leq f_{0}(x^{*})$
条件
$f_{i}(x^{*})\leq 0\\ h_{i}(x^{*})= 0\\ \lambda_{i}^{*}\geq 0\\ \lambda_{i}^{*}f_{i}(x^{*})= 0\\ i=1...m\\ \bigtriangledown f_{0}(x^{*})+\sum \lambda_{i}^{*}\bigtriangledown f_{i}(x^{x})+\sum\upsilon _{j}^{*}\bigtriangledown h_{j}(x^{*})=0$

数据结构与算法最新文章

【力扣106】从中序与后续遍历序列构造二叉

leetcode 322 零钱兑换

哈希的应用：海量数据处理

动态规划|最短Hamilton路径

华为机试_HJ41 称砝码【中等】【menset】【

【C与数据结构】——寒假提高每日练习Day1

基础算法——堆排序

2023王道数据结构线性表--单链表课后习题部

LeetCode 之反转链表的一部分

【题解】lintcode必刷50题＜有效的括号序列

加:2022-02-27 11:02:06 更:2022-02-27 11:03:31

360图书馆购物三丰科技阅读网日历万年历 2026年3日历

-2026/3/5 17:23:13-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码