| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 深度学习笔记(一)二分分类 | logistic regression(详细的损失函数理解) -> 正文阅读 |
|
[人工智能]深度学习笔记(一)二分分类 | logistic regression(详细的损失函数理解) |
基于https://www.bilibili.com/video/BV164411m79z?p=24?观后笔记 相关函数定义介绍 但由于实质相同,都是事先定义一个假设函数,通过训练集由算法找出一个最优拟合,即使得函数值最小(如通过梯度下降法),从而估计出假设函数的参数。所以往往我所看到的大多将代价函数和损失函数视为同一东西,下文就不给予区分,以损失函数来讲。(求和除以样本数的为代价函数,否则为损失函数) 损失函数 但是并不是损失函数越小,结果就越好。 如何理解整个分类过程 1.首先从初中学习的线性回归来看(下图) 给出了一系列数据(红点),我们要做的就是找到一条合适直线来拟合这些数据的分布,本质上来说就是找到满意的参数 2.而逻辑回归也是如此,只不过初中是直接简单粗暴的通过公式的出了这么一条直线,而现在是要不断试错,不断改进地找出满意的参数 首先我们也假设训练集符合 z(x) 这个函数,通过输出x可以得到”预测值“z。 请注意,我们希望的是预测值可以告诉我们”该分到哪一类“,比如有一张图片,我们希望通过输入图片的RGB,得到的是这张图可不可以判断它上面是猫的概率 而概率只有0~1才有意义,因此最后的输出结果应该只能有0~1,然后这里显然z的值是我们难以预料了,可能很大,甚至可能是负值。因此,我们引入sigmoid函数 ? 这样就把结果限制在0~1了,下面称y_hat / y帽 / y^ 为新预测值(下文直接称为预测值) 这个y_hat就是我们希望得到的结果(即已知x|y=1的概率),更具体的说,也是正向传播中的一个产物。至此sigmoid(z)就是我们的预测函数 重点来了: 不过在继续之前,先来讲讲怎么找到这个损失函数 通过y_hat的定义,我们可得出: 这确实就是一个离散型的概率函数 进一步得到这个概率函数的最终表达式:
不过我们还是验证这个公式的正确性的,但是视频里有讲解(P24),这里就不赘述了。 又根据概率论中最大概率原理:发生了的就是概率最大的 所以,我们要让P(y|x)最大,因为在训练过程中,y是知道的。(其实就是想成概率论中用极大似然估计求参数这类题,y是观测值之一。) 怎么取最大呢?用回解题的套路,先给它整个log(也是因为log单调函数,不会影响找P(y|x)最大值,log(P(y|x)),? P(y|x)也最大)然后我们就可以得到: 并让它最大化 这时候,再回想起我们的损失函数,我们要使损失最小化,这不就和这个函数的要求相反了吗?那我们在这个log函数的基础上添个负号不就弄出损失函数了? 从而定义损失函数 ?要注意的是损失函数是针对单个样本的,而对应整个训练集,我们引入成本函数(Cost Function)。 这里要回想起概率论中的极大似然估计,这一整组训练集已经”发生“,根据极大似然估计,此情况发生的概率要是最大的! 所以有下列推导 同样的,我们要最大化这个求和,而总体的成本函数要最小化,所以定义成本函数为 去掉了负号,同时加了个1/m的因子,个人理解是将总成本分摊到每个训练集,由此获得比单个训练集的损失函数值更具代表性的值 ?至此,其实就完成了正向传播的准备,要做的就是像视频那样用numpy模块&矩阵运算的知识把for循环去掉,进行算法上的优化。 反向传播也可以从视频了解到过程。 ? ? ? ? ? ? ? ? ? ? ? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 11:01:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |