| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 集成学习作业Task02 -> 正文阅读 |
|
[人工智能]集成学习作业Task02 |
集成学习作业Task02本文为Datawhale组队学习项目——集成学习的作业Task 作业2(1)线性回归模型的最小二乘表达线性回归模型: 最小二乘表达式 为了达到求解最小化L(w)问题,我们应用高等数学的知识,使用求导来解决这个问题:
?
L
(
w
)
?
w
=
2
X
T
X
w
?
2
X
T
Y
=
0
,
可
得
w
^
=
(
X
T
X
)
?
1
X
T
Y
\\ \frac{\partial L(w)}{\partial w} = 2X^TXw-2X^TY = 0, \\ 可得 \hat{w} = (X^TX)^{-1}X^TY
?w?L(w)?=2XTXw?2XTY=0,可得w^=(XTX)?1XTY (2)极大似然估计与最小二乘法的联系什么是极大似然估计? 将 w w w作为参数,我们得到当前样本出现的概率 P ( Y ∣ X ; w ) , P(Y|X;w), P(Y∣X;w), 令 L ( w ) = l o g ?? P ( Y ∣ X ; w ) = l o g ?? ∏ i = 1 N P ( y i ∣ x i ; w ) = ∑ i = 1 N l o g ?? P ( y i ∣ x i ; w ) L(w) = log\;P(Y|X;w) = log\;\prod_{i=1}^N P(y_i|x_i;w) = \sum\limits_{i=1}^{N} log\; P(y_i|x_i;w) L(w)=logP(Y∣X;w)=log∏i=1N?P(yi?∣xi?;w)=i=1∑N?logP(yi?∣xi?;w),则 L ( w ) L(w) L(w)被称为似然函数,我们的目的是求得使似然函数最大的 L ( w ) L(w) L(w),也就是 a r g m a x w L ( w ) argmax_w L(w) argmaxw?L(w) 如何求解
w
,
使
得
a
r
g
m
a
x
w
L
(
w
)
?
w,使得argmax_w L(w)?
w,使得argmaxw?L(w)?,我们需要先假设数据服从正太分布,
y
i
∽
N
(
w
T
x
,
σ
2
)
y_i \backsim N(w^Tx,\sigma^2)
yi?∽N(wTx,σ2),同时数据的噪声也
?
∽
N
(
0
,
σ
2
)
\epsilon \backsim N(0,\sigma^2)
?∽N(0,σ2),则可得如下公式 与最小二乘法的联系 因 此 : 线 性 回 归 的 最 小 二 乘 估 计 < = = > 噪 声 ? ∽ N ( 0 , σ 2 ) 的 极 大 似 然 估 计 因此:线性回归的最小二乘估计<==>噪声\epsilon\backsim N(0,\sigma^2)的极大似然估计 因此:线性回归的最小二乘估计<==>噪声?∽N(0,σ2)的极大似然估计 (3)多项式为什么表现不好当多项式中阶数取较大时,多项式曲线就会越光滑,在X的边界处有异常的波动。导致预测效果的稳定性下降。 (4)决策树模型与线性模型的联系和差别线性模型的模型形式与树模型的模型形式有着本质的区别,具体而言,线性回归对模型形式做了如下假定: f ( x ) = w 0 + ∑ j = 1 p w j x ( j ) f(x) = w_0 + \sum\limits_{j=1}^{p}w_jx^{(j)} f(x)=w0?+j=1∑p?wj?x(j),而回归树则是 f ( x ) = ∑ m = 1 J c ^ m I ( x ∈ R m ) f(x) = \sum\limits_{m=1}^{J}\hat{c}_mI(x \in R_m) f(x)=m=1∑J?c^m?I(x∈Rm?)。 那问题来了,哪种模型更优呢?这个要视具体情况而言,如果特征变量与因变量的关系能很好的用线性关系来表达,那么线性回归通常有着不错的预测效果,拟合效果则优于不能揭示线性结构的回归树。反之,如果特征变量与因变量的关系呈现高度复杂的非线性,那么树方法比传统方法更优。 决策树在可解释性和处理缺失值和异常值方面比线性模型要优。但预测准确性可能比其他回归模型差。 (5)什么是KKT条件对于具有不等式约束的最优化问题, (6)为什么引入原问题的对偶问题?是因为原问题与对偶问题就像是一个问题两个角度去看,如利润最大与成本最低等。有时侯原问题上难以解决,但是在对偶问题上就会变得很简单。任何一个原问题在变成对偶问题后都会变成一个凸优化的问题,而凸优化问题在最优化理论较为简单。 (7)线性回归实例作业所需数据 akti 此数据是一份空气质量的检测资料,来自李宏毅老师的机器学习公开课,train.csv给出了整个2014年,每个月前20天的数据,这些数据包含了共计18个特征,在这些天每一个小时的变化。我们所需要的根据这些数据训练出一个模型,要求根据前九个小时的数据,预测出第10个小时的PM2.5。 读取数据
数据提取与变换
将资料按照每月划分
这样month_data所存储的就是这个月的相关数据。 根据题目的要求,我们需要按照前九个小时的数据来得到第十个小时的数据,也就是前9个小时的18个features作为特征,第十个小时的PM2.5作为结果来构建regression回归,实际上所需要得到的就是一个含有18*9=162个系数的一维特征数组。而我们需要根据到手的数据制作训练集与测试集。 特征提取
Normalize归一化
划分训练集和验证集
采用线性模型训练
使用验证集验证模型
参考资料https://zhuanlan.zhihu.com/p/38128785 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 14:26:27- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |