IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 集成学习-基础数学模型回归 -> 正文阅读

[人工智能]集成学习-基础数学模型回归

参考链接
作业详情链接
参考学习的教案链接

1、最小二乘法的表达式:
假设研究的问题有n个样本。
X = ( x 1 , x 2 , . . . , x n ) T X=(x_1,x_2,...,x_n)^T X=(x1?,x2?,...,xn?)T
Y = ( y 1 , y 2 , . . . , y n ) T Y=(y_1,y_2,...,y_n)^T Y=(y1?,y2?,...,yn?)T
L ( W ) = 1 2 ( X W ? Y ) T ( X W ? Y ) L(W)=\frac{1}{2}(XW-Y)^T(XW-Y) L(W)=21?(XW?Y)T(XW?Y)

2、极大似然估计和最小二乘法的关系?
个人认为,两者本质上是同一个问题,极大似然估计是针对概率密度函数 P ( Y ∣ X , W ) P(Y|X,W) P(YX,W)寻找到使得P最大的W,也就是最优的W。同理,最小二乘法是找到使得L(W)最小的W,也就是最优的W.
只不过二者的出发点不同,极大似然估计是从概率的角度出发,求解的也是已知的概率密度函数,而最小二乘法是优化的L(W)。
如果假设这个概率密度模型是 N ~ ( μ , σ 2 ) N\sim (\mu,\sigma^2) N(μ,σ2),那么根据正态分布的密度函数可以类比写出: 1 2 π σ e x p ( ? ( Y ? X W ? 0 ) 2 2 σ 2 ) → 1 2 π σ e x p ( ? ( Y ? μ ) 2 2 σ 2 ) , 其 中 假 设 μ = X W \frac{1}{\sqrt{2\pi \sigma}}exp(-\frac{(Y-XW-0)^2}{2\sigma^2})\to \frac{1}{\sqrt{2\pi \sigma}}exp(-\frac{(Y-\mu)^2}{2\sigma^2}),其中假设\mu = XW 2πσ ?1?exp(?2σ2(Y?XW?0)2?)2πσ ?1?exp(?2σ2(Y?μ)2?),μ=XW.
根据正态分布的性质可得: μ \mu μ越接近 Y Y Y ( Y ? W X ) 2 (Y-WX)^2 (Y?WX)2值越小,则概率值越大,也就是求解 μ \mu μ的极大似然估计。

3、为什么多项式回归在实际问题中表现不好?
多项式回归容易受到异常值的影响,在数据密度较少的区域会产生很大的波动。

4、什么是KKT条件?

Karush-Kuhn-Tucker (KKT)条件是非线性规划(nonlinear programming)最佳解的必要条件。也就是最优解 x ? x^* x?必满足KKT条件,但是满足KKT条件的点未必是最优解。
证明:
针对这样的一个不等式约束问题:
min ? f ( x ) s . t . g i ( x ) ≤ 0 , i = 1 , 2 , . . . , m h j ( x ) = 0 , j = 1 , 2 , . . . , l \min f(x)\\ s.t. g_i(x)\leq 0,i=1,2,...,m\\ h_j(x) = 0,j=1,2,...,l minf(x)s.t.gi?(x)0,i=1,2,...,mhj?(x)=0,j=1,2,...,l
假设 x ? x* x?是最优解。同时定义可行域 K = x ∣ g i ( x ) ≤ 0 , i = 1 , 2 , . . . , m , h j ( x ) = 0 , j = 1 , 2 , . . . , l K={x| g_i(x)\leq 0,i=1,2,...,m,h_j(x) = 0,j=1,2,...,l} K=xgi?(x)0,i=1,2,...,m,hj?(x)=0,j=1,2,...,l

  • 如果 x ? x^* x?在可行域内,那么该优化问题就退化为无约束优化问题。则 ? f ( x ? ) = 0 \nabla f(x^*) =0 ?f(x?)=0.
  • 如果 x ? x^* x?在可行域边界上,则梯度 ? f ( x ) \nabla f(x) ?f(x)是指向可行域内部的,而 ? g ( x ) \nabla g(x) ?g(x)是指向可行域外部(这是因为 g i ( x ) ≤ 0 g_i(x)\leq 0 gi?(x)0)。
    所以可以写出 ? f ( x ) = ∑ i λ i ? g i ( x ) \nabla f(x) = \sum_i \lambda_i \nabla g_i(x) ?f(x)=i?λi??gi?(x).
    根据拉格朗日乘子法:
    L ( x , λ , μ ) = f ( x ) + ∑ i λ i g i ( x ) + ∑ j μ j h j ( x ) L(x,\lambda,\mu) =f(x) + \sum_i \lambda_i g_i(x) + \sum_j\mu_j h_j(x) L(x,λ,μ)=f(x)+i?λi?gi?(x)+j?μj?hj?(x)
    所以可以写出最优化问题的KKT条件:
    ? x L = 0 ( 对 偶 条 件 ) h j ( x ) = 0 , j = 1 , 2 , . . . , l g i ( x ) ≤ 0 , i = 1 , 2 , . . . , m λ i ≥ 0 , i = 1 , 2 , . . . , m ( 对 偶 条 件 ) λ i g i ( x ) = 0 , i = 1 , 2 , . . . , m ( 互 补 松 弛 定 理 ) \nabla_x L = 0 (对偶条件)\\ h_j(x) = 0,j=1,2,...,l\\ g_i(x) \leq 0,i=1,2,...,m\\ \lambda_i \geq 0,i=1,2,...,m(对偶条件)\\ \lambda_i g_i(x) =0,i=1,2,...,m (互补松弛定理) ?x?L=0hj?(x)=0,j=1,2,...,lgi?(x)0,i=1,2,...,mλi?0,i=1,2,...,mλi?gi?(x)=0,i=1,2,...,m

5、为什么引入原问题的偶问题?

  • 灵敏度分析
  • 根据弱对偶理论或者强对偶理论,帮助计算原问题。
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-20 15:05:55  更:2021-08-20 15:06:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/12 0:55:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码