IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【机器学习】逻辑回归 -> 正文阅读

[人工智能]【机器学习】逻辑回归

上一篇:【机器学习】线性回归(超详细)


目录

逻辑回归的假设函数

决策边界

?代价函数

正则化

过拟合的问题

正则化之后的代价函数

正则化线性回归的实现(逻辑回归同理)


?逻辑回归属于监督学习里的分类问题,所谓“分类”,指的是:因变量y取值为离散的情况,一般取值为0或1.这决定了逻辑回归算法中的一个比较重要的性质:它的输出值永远在0到1之间。所以,我们的假设函数就不能和线性回归的假设函数一样,而需要重新定义。

逻辑回归的假设函数

逻辑回归的假设函数:h_{\theta }(x)=g(\theta ^{T}x)=g(z)=\frac{1}{1+e^{-z}}=\frac{1}{1+e^{-\theta ^{T}x}}

?对模型的理解:g(z)=\frac{1}{1+e^{-z}}

h_{\theta }(x)的作用是:对于给定的输入变量,根据选择的参数计算输出变量=1的可能性。即h_{\theta }(x)带有一定的概率含义。

例如,对于给定的x,通过已知的参数计算出 h_{\theta }=0.7,则表示有70%的概率y为1.

决策边界

?我们对决策边界概念的理解能够更好的帮助我们理解逻辑回归的假设函数在计算什么。下面讲决策边界的概念:

?

在逻辑回归中,我们预测:

h_{\theta }(x)>=0.5时,预测y=1.

h_{\theta }(x)<0.5时,预测y=0.

根据上面绘制的图像,我们知道:

当z>=0时,g(z)>=0.5

当z<0时,g(z)<0.5

又因为z=\theta ^{T}x,即

\theta ^{T}x>=0时,预测y=1.

\theta ^{T}x<0时,预测y=0.

举个例子:

大于这条线的部分预测y=0,小于这条线的部分预测y=0.?这条线就叫做决策边界

?

?代价函数

对于线性回归,我们知道它的代价函数为:J(\theta )=\frac{1}{2m}\Sigma _{i=1}^{m}(h_{\theta }x^{(i)}-y^{(i)})^{2},我们可以对其进行梯度下降求最小值。其中可以用梯度下降最根本的原因在于它是一个凸函数,如下图所示

?在逻辑回归中,如果还用和线性回归一样的代价函数的话,是求不到全局的最小值的,只能求到局部的最小值。这是因为,逻辑回归的假设函数变成了h_{\theta }(x)=g(\theta ^{T}x)=g(z)=\frac{1}{1+e^{-z}}=\frac{1}{1+e^{-\theta ^{T}x}}。将其带入J(\theta )=\frac{1}{2m}\Sigma _{i=1}^{m}(h_{\theta }x^{(i)}-y^{(i)})^{2}?可得到它的图像为:

?由此我们知道,我们需要重新定义逻辑回归的代价函数。且这个代价函数一定是一个凸函数。

?所以,逻辑回归的代价函数有如下定义:J(\theta )=\frac{1}{m}\Sigma _{i=1}^{m}cost(h_{\theta }(x^{(i)}),y^{(i)})

?这样构建cost(h_{\theta }(x^{(i)}),y^{(i)})函数的特点是:当实际的 𝑦 = 1 ?𝜃(𝑥)也为 1 时误差为 0, 当 𝑦 = 1 ?𝜃(𝑥)不为 1 时误差随着?𝜃(𝑥)变小而变大;当实际的 𝑦 = 0 ?𝜃(𝑥)也为 0 时 代价为 0,当𝑦 = 0 ?𝜃(𝑥)不为 0 时误差随着 ?𝜃(𝑥)的变大而变大。

?在得到这样一个代价函数以后,我们便可以用梯度下降法来求得代价函数取最小值时的参数了。算法为:

注:虽然得到的梯度下降算法表面上看上去与线性回归的梯度下降算法一样,但是这里 的? 𝜃 (𝑥) = 𝑔(𝜃 𝑇 𝑋) 与线性回归中不同,所以实际上是不一样的。另外,在运行梯度下降算法之前,进行特征缩放依旧是非常必要的。

正则化

正则化的思路:尽量减少参数\theta的值。

正则化的目的:改善或减少过度拟合的问题。

下面介绍什么是过拟合问题。

过拟合的问题

到现在为止,我们学习了线性回归和逻辑回归,但是在应用过程中,可能会遇到过拟合问题,导致它们解决问题的效果很差。那么什么是过拟合?

下面是一个回归问题的例子:

第一个模型很明显是欠拟合,即不能很好的适应我们的数据。第三个模型虽然能够很好的拟合原始数据(训练集),但是它却不能很好的拟合测试集,若给出一个新的值让它预测的话,它将预测的很差。而中间的模型则是最适合的,既能很好的拟合原始数据,又能很好的预测新的数据。

同样的,分类问题也存在这样的问题:

?

我们也可以这样理解过拟合:?𝑥 的次数越高,拟合的越好,但相应的预测的能力就可能变差。

问题是,如果我们发现了过拟合问题,应该如何处理?

1. 丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一 些模型选择的算法来帮忙(例如 PCA )。
2. 正则化。 保留所有的特征,但是减少参数的大小( magnitude )。

正则化之后的代价函数

我们可以从之前的示例中看出,正是由于那些高次项导致了过拟合的产生。所以,如果我们能够让那些高次项系数接近于0的话,我们就能够很好的拟合了。但是往往在实际问题中,我们并不知道哪些参数是高次项的系数,于是,我们便将所有的参数进行减小。所以我们要做的是在一定程度上减少所有\theta的值,这就正则化的基本方法。

回归问题正则化之后的代价函数:J(\theta )=\frac{1}{2m}[\Sigma _{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)})^{2}+\lambda \Sigma _{j=1}^{n}\theta _{j}^{2}]其中𝜆又称为正则化参数(Regularization Parameter)。 注:根据惯例,我们不对𝜃0 进 行惩罚(因为x0=1,是个常数)。

那么为什么增加一项\lambda \Sigma _{j=1}^{n}\theta _{j}^{2},就可以使\theta变小呢?

因为如果我们令\lambda值很大的话,为了使代价函数的值尽可能的减小,所有的\theta值都会在一定程度上减小(不包括\theta _{0})。但是\lambda值太大的话,那么\theta(不包括\theta _{0})都会趋向于0,这样我们得到的只能是平行于x轴的直线。

?所以对于正则化,我们要取一个合理的 𝜆 的值,这样才能更好的应用正则化。

正则化线性回归的实现(逻辑回归同理)

我们知道:J(\theta )=\frac{1}{2m}[\Sigma _{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)})^{2}+\lambda \Sigma _{j=1}^{n}\theta _{j}^{2}]

?如果我们要使用梯度下降法令这个代价函数最小化,因为我们未对第一项的参数进行正则化,所以梯度下降法分为两种情形。

?可以看出,正则化线性回归的梯度下降算法的变化在于,每次都在原有算法更新规则的基础上令𝜃值减少了一个额外的值。

?

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-05 21:44:41  更:2022-02-05 21:47:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 19:40:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码