IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习及其参数更新时梯度的求解 -> 正文阅读

[人工智能]深度学习及其参数更新时梯度的求解

深度学习及其参数更新时梯度的求解

1. 神经网络

机器学习中提到的神经网络是指神经网络学习,是机器学习与神经网络这两个学科领域的交叉部分。神经网络的定义有很多种,这里说下自己的理解:神经网络是基于大量简单模型“连接”搭建起来的学习模型,而这个简单模型就是神经元模型。在生物体内,神经元与神经元之间通过突触进行信号传递,且神经元在传递信号时,需要上一神经元的刺激信号超过阈值才能使当前神经元产生激活信号。如果按超过阈值为1,低于阈值为0(不触发信号)这种机制来看,这个和计算机中的高低电平概念很像。如此说来,生物大脑,计算机,神经网络都有相似之处,通过最基础的元件大量组合,从而产生智能。

1.1 神经元模型

最经典的神经元模型就是M-P神经元模型,这个模型接收n个其他神经元传递而来的信号,而这些信号按照一定权重进行连接,收到信号的总和会与阈值进行比较(减去阈值),然后再通过激活函数处理,产生本神经元的输出。

image-20220522190649694

一个神经元有多少参数呢?一般来说,神经元存储着所有输入的权重信息,和一个本身的偏置信息,如果有n个输入,则其参数为n+1,但这里有个问题,就是后面训练时,好像我们不对偏置进行优化,在线性回归时我们也碰到这个问题,即偏置不优化对最后结果没有影响。那么对于神经网络来说,偏置是否也是不需要优化的呢?这个大家可以去查一些相关资料,目前我了解的是,有些神经网络确实不需要偏置这一项。

1.2 感知机与多层网络

感知机由两层神经元组成,一层输入,一层输出。这里输入貌似直接给数值,没有啥特殊的。输出层则是一个M-P神经元,像M-P这样的神经元,也称为“阈值逻辑单元”,感知机只有一层功能神经元。感知机能实现逻辑操作与,或,非运算,这一点又让我想起了计算机。

image-20220522220830297

感知机其实只有一层网络,学习能力有限,而在输出层与输入层之间添加神经元,这些神经元称为隐藏层或者隐含层,隐藏层神经元和输出层都是具有激活函数的功能神经元。

image-20220522221722495

多层前馈神经网络指包含隐藏层,每层神经元与下一层神经元全互连,神经元之间不存在同层连接与跨层连接,这种神经网络结构就是多层前馈神经网络。一般来说,神经网络学习到的模型,蕴含在连接权重和阈值之中(所以有些神经网络是需要训练阈值的)。

2. 反向传播

2.1 误差逆传播算法-BP

至今最成功的神经网络训练算法就是误差逆传播算法,目前大多算法都是使用BP算法进行训练的,而目前会说BP网络,其实就是指使用BP算法训练的多层前馈神经网络

image-20220522223010348

2.2 向前传播与向后传播

  • 求导的链式法则

首先需要知道链式法则,因为在求代价函数关于每层权重的偏导时会经过中间函数(中间神经元),会用到以下Case2的案例,而在分解代价函数关于权重的偏导时,会用到Case1.

image-20220522223916800

  • 代价函数关于权重偏导的分解

关于每层权重的导数可以分解为两部分:

image-20220522223451495

其中向前传播部分在有输入数据时就可以全部算出来,由输入层数据一层层向输出层计算。而向后传递部分则需要由输出层数据向输出层传递。

  • 向前传播

个人理解,这里向前传播是说根据输入层数据,依次往前计算,确定每层神经元中关于权重的偏导,毕竟这个偏导就等于输入。

image-20220522223324267

  • 向后传播

image-20220522224316466

向后传播主要计算z值经过激活函数后,代价函数关于前面z的偏导。

如果后面一层是输出层,那么其中代价函数关于前一层的两个z值是可以直接求出的。如果不是输出层,那么这里的值也可以通过输出层那里的值一步步计算出来。

image-20220522224540279

参考

西瓜书-周志华

P13 深度学习简介 (datawhalechina.github.io)

P14 反向传播 (datawhalechina.github.io)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-24 18:10:12  更:2022-05-24 18:12:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 5:51:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码