| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习——线性模型 -> 正文阅读 |
|
[人工智能]机器学习——线性模型 |
文章目录西瓜书机器学习第三章贴上又一位宝藏up主的传送门二次元的Datawhale的个人空间_哔哩哔哩_bilibili
线性回归线性关系
上图举例,数据集D由(x1,y1),(x2,y2)…(xm,ym)组成,其中每个(xi,yi)中的x有由(xi1,xi2…xid)组成,此时有参数w,w由(w1,w2…wd)组成,预测关系为wx1+b=y1’(注意这里面的w和x1是对应的w1 * x11+w2 * x12+wd * x1d;y1‘是预测值),wx2+b=y2’…wxd+b=yd’,我们想要的是预测值ym’和真实值ym差距最小,使用的方法是 所以要求出[(y1-y1’)2+(y2-y2’)2+…+(yd-yd’)^2]min,这个公式观察发现,yd’是由wxd+b所求,xd、yd是已知的,要求的就是w和b 一元线性回归如果是一元线性回归,上述公式的d=1,w和b为单个的数,如下图所示 其实可以很形象的看做矩阵的相乘,比如 x * w +b =y,可以理解成是 X(m * d矩阵) * W的转置(d * 1矩阵)+b(m * 1) = Y(m * 1矩阵),将上述的公式单独拿出对w求导可得 对b求导可得 导数为0求解 极大似然估计其实这是有一段解释的话语,用来估计概率分布的参数值,形象理解,其实就是用所看到的样本值估计总体的一个分布值 这里引入正态分布的公式 其实引入极大似然估计是为了计算后面的模型,对于线性模型,其实我们清楚,y=wx+b+e,这个e可以理解为误差,那根据常识,误差其实有正负,也有一定范围,默认是服从均值为0的正态分布e ~ N(0,o’^2),那很显示e就满足了如下的公式,并且用e=y-(wx+b)代替可得第二个公式(就是可以将wx+b看作是μ) 将上式进行极大似然估计法处理后如下 最终要求此公式的最大值,后面有个负号,那不就是求负号连接的最小值嘛?却突然发现,这不就是最小二乘法估计
凸集、凸函数这里的凸函数并不是形状有关的,y=x^2是凸函数一个代表 梯度求梯度其实就是求偏导数,比如求y=w1x1+w2x2+b求梯度,那就是对x1、x2求导分别为w1、w2,所以其梯度/一阶导数就是[w1 w2] (注意这里是列向量(分母布局)) 海塞矩阵(Hessian)引入海塞矩阵最终还是为了证明E(w,b)是关于w和b的凸函数,这里我们可以看到是需要证明半正定的 下面是四个二阶导推导过程 下图就是计算出了二阶导数组成的矩阵,最终的判断是下图最终的式子是否为非负,
推导的过程如下,这里运用了x均值的知识,最终得证是凸函数 既然得证凸函数,那势必就有最小值点(想象y=x^2),也就是该点导数为0,那不就是求E(w,b)的梯度嘛 在上述推导4个二级导数的时候,已经求过w、b的导数,直接拿来,下面是求b,化简为y的均值-w*x的均值 再求出w的值,将b值代入即可,这就是求出了最开始给出的w、d的值 多元线性回归默认的布局是分母布局,也就是列向量 对于上图中3.10公式求导,其实我们还可以利用一元线性的知识,证明凸函数再用最小值求出w 公式求导 注意上述求出的是一阶导数,海塞矩阵是二阶导数 证明完凸函数后,一阶导数为0,求出w 对数线性回归广义线性模型形象理解就是y和x并没有直接线性关系,但是g(y)和x有线性关系,上述的对数线性回归,实则是加了ln,这种得到的模型也就属于广义线性回归 对数几率回归(逻辑回归)
设想一种情况,y的取值只有几种,这就转换为了分类的问题,y的取值就被分成三个区间 根据上图公式求解 线性判别分析LDA的思想十分的朴素,就是给定训练的样例集,设法将样例投影到一条直线上,使得同类的投影点尽可能的近,非同类的尽可能的远,形象理解:二维坐标好多点,是有类别的,这一块,那一堆,我们作一条直线,所有的点按照垂直线映射在这条直线上(详述不全,后补) 类别不平衡的问题处理方法设想之前提及的逻辑回归,分类问题,当数据正反例可能性相同 y/(1-y) >1,也就是大于0.5,预测为正例,反之则为反例 假设出现训练集样本是总体样本的无偏采样(解释无偏采样,就是总体样本什么比例,采集的就是什么比例),当正例数量为m+,反例的数量为m-,有 y/(y-1) > m+/m- ,此时为正例,也可以改为 (y/(y-1) ) * m-/m+ = y’/(y’-1),等同于上面的y/(1-y) >1 假设不知道采样的几率,可以采用如下方法:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 2:39:57- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |