| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> Chapter 5 Deep Learning -> 正文阅读 |
|
|
[人工智能]Chapter 5 Deep Learning |
Backpropagation引入话题从前面的学习的梯度下降法我们可以知道: 其中,梯度
?那么如何有效得将百万维的向量计算出来,这时候我们就需要使用Backpropagation 所需的数学知识——链式法则情况一: ? ? ? ? ? ? ?? ? ? ? ? ? ? ? 那么: 情况二: ? ? ? ? ? ?? ? ? ? ? ? ? 那么:? 设置一个损失函数:
取神经网络中的一部分来说明: ? Forward pass和Backward pass计算所有的参数的偏导数
?计算所有激活功能输入值的偏导数
由于z在正向传递( forward pass)中已经确定,所以 ?情况一:红色圈圈位置就是输出层
?那么: 情况二:红色圈圈位置不是输出层
?利用递归的方法,直到找到输出层,从后向前偏导,拿下图举例: 已知了 所以可以求得 总结步骤:先求出Forward?pass,后求出Backward pass,两者相乘得出最终的某个参数的偏导数,进而求得损失函数。
?Tips for Training DNN深度学习的秘诀过拟合并非是我们面临的第一个问题,我们需要确定神经网络在训练数据中是否可以得到一个好的结果,如果没有,重新进行三步走,看看哪步需要做出一些修改;如果有好的结果且在测试数据中没有得到好的结果,那么就可以判断为过拟合。
?当看到下面这个图,56层的比20层的测试误差更大,就会判定应该是参数过多,出现过拟合。那么事实上真的是这样吗?这个时候我们需要查看训练数据上两者的情况做出正确的判断。
我们从训练数据可以看到56层的神经网络是没有训练好。
new activation function
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年12日历 | -2025/12/10 2:22:52- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |