IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 图深度学习——卷积神经网络&循环神经网络&自编码器 -> 正文阅读

[人工智能]图深度学习——卷积神经网络&循环神经网络&自编码器

卷积神经网络

常用做图像分类任务。举例:识别图中的兔子
在这里插入图片描述
前馈神经网络做兔子图像识别
图像可以通过矩阵表示,然后将矩阵转换成向量,就可以作为前馈神经网络的输入,但是
1.参数量就非常大,需要大量数据进行训练,不然模型泛化能力会不够好。

2.图像中兔子的位置改变后,前馈神经网络就无法处理,因为当兔子在图像中的位置改变后,图像矩阵转换成向量的值也会不同,那么就需要模型去学习很多数据。
因此前馈神经网络并不能很好的处理这样的图像分类问题,兔子位置改变,同样都是兔子的图像数据经过前馈神经网络后可能出现不相同的输出,即不能很好的捕捉兔子的信息进行分类。
在这里插入图片描述

卷积神经网络就解决了上述问题。
在这里插入图片描述

卷积

稀疏连接

在这里插入图片描述
左边:全连接,右边:卷积
S 3 S_3 S3? 在全连接中,与所有的神经元相关; S 3 S_3 S3? 在卷积中,只与周围邻接神经元相关,而不是和所有神经元相关。由此可知,稀疏连接的作用是让网络的输出仅仅关注与之相邻的神经元,而不是关注整个神经元。

参数共享

在这里插入图片描述
同一批参数参与一次计算——卷积核

卷积操作

滑动卷积核来进行卷积操作。通常不止是用一个卷积核,而是使用多个卷积核(不同卷积核中参数是不一样的)如下图所示,是一维卷积操作。
在这里插入图片描述
二维卷积也是类似的滑动操作。
在这里插入图片描述

平移等变

参数共享带来好处——平移等变,输入滑动一格,输出也会同等滑动一格。通过这样的平移等变的特点,捕捉到的信息都是一样的,只是位置是不同的,这样就大大的增加了表达性,提高了模型的泛化能力。

卷积操作性质

  1. 稀疏连接
  2. 参数共享
  3. 平移等变

前两点性质使得卷积神经网络相对于前馈神经网络有更好的可拓展性(Scalability)。三个性质使得卷积神经网络有更好的泛化能力( Generalization)。
在这里插入图片描述

池化

池化能够扩大模型的感受野,即每个输出对应的输入的区域能够更大
在这里插入图片描述
最大池化:求感受野中的最大值
平均池化:求感受野中所有值的平均

卷积神经网络整体框架

在这里插入图片描述
如图所示是二维的卷积神经网络。卷积再池化其实是一个特征提取的过程,最后对数据转换为向量通过一层神经网络来进行分类输出。

循环神经网络

RNN处理序列数据:文字、时序(股票等)

序列数据上的任务

机器翻译:输入是一个序列,输出也是一个序列
语义分析:输入是一个序列,输出可能只是一个元素(好/坏)
在这里插入图片描述
可以用前馈神经网络来处理序列数据嘛?
不可以。
1.因为序列可能长短不一,那么前馈神经网络就不好处理了;如果想要使用前馈神经网络需要对序列长度进行统一,固定。
2.序列数据中同一信息可能出现在序列的不同位置,那么前馈神经网络无法处理这样的问题,无法输出相同的信息。

循环神经网络

循环神经网络中有两个输入,一个是 h 0 h_0 h0?:初始化信息或来自上一步的信息;一个是输入 x 1 x_1 x1?,通过网络将两个输入都整合起来。
其中通过前馈神经网络来建模, h i h_i hi? 作为当前步积累的信息传到下一步中, y i y_i yi? 是当前步的输出(有需要的话),因此RNN也存在一定灵活性。在RNN中,参数也是共享的。
在这里插入图片描述
序列增长,就增加对相应 x x x 的计算,这样就解决了序列长度不一的问题。因为参数事共享的,那么不同位置的相同信息能够被捕捉到。

RNN的性质

  1. 处理不同长度的序列
  2. 捕捉序列的顺序信息
  3. 参数共享

RNN梯度消失和梯度爆炸

在这里插入图片描述
当关注最后一个输出时,可以发现计算这个输出的权重是需要不断往前计算。在计算梯度的过程中,会涉及到 W h h W_hh Wh?h 的连续相乘。比如,当一些小于1的权重连续相乘时,结果就会越来越小,趋近于0,这样以来梯度就消失了。因此,RNN无法捕捉到很长距离的信息。

Last summer, I went to Yellowstone Natiinal Park. I went to Yellowstone National Park last summer.

比如这里的last summer可能就会因为距离过长而导致无法捕捉信息,导致对后面的计算影响不大。

那么当一些大于1的权重连续相乘时,结果就会越来越大,就会出现梯度爆炸。

LSTM 长短时记忆网络

为了缓解RNN中梯度问题,提出了改进的RNN模型——LSTM。整体结构是和RNN类似的,但是神经网络部分使用LSTM模块取代。

在这里插入图片描述

LSTM神经单元

在这里插入图片描述
在LSTM神经单元中,相比RNN增加了1个状态值,就是单元状态(Cell State)。 h t h_t ht? 相当于RNN中的 y t y_t yt?,需要时可以直接输出,不需要也存在。
在这里插入图片描述
红色高亮部分就是LSTM单元中的门(gate,运算).

遗忘门:在LSTM中,之前序列的信息是保留在 C t C_t Ct? 中。遗忘门控制哪些历史信息可以通过网络。遗忘门也是通过前馈神经网络来进行建模的。 W f W_f Wf? U f U_f Uf? 都是参数, b f b_f bf? 是偏差。
在这里插入图片描述

输入门:控制哪些新的信息可以进入网络。
在这里插入图片描述

候选值:更新 C t C_t Ct? 时,要从输入信息中选一些信息来更新。 C t C_t Ct? 候选值计算公式如下:
在这里插入图片描述

新的单元状态–更新 C t C_t Ct?:通过遗忘门来判断保留哪些信息,然后结合上面计算得到的候选值来更新单元状态 C t C_t Ct?
在这里插入图片描述

输出门:建模方式和输入门,遗忘门相同,参数不同。输出门用来生成 h t h_t ht? h t h_t ht?在很多时候会作为输出。LSTM的输出就是对单元状态和包含之前序列信息的结合。
在这里插入图片描述
在这里插入图片描述

GRU

对LSTM进行了一些优化,把一些门合并。
在这里插入图片描述

自编码器

现实世界中,大多数数据是没有ground truth,因此要采用无监督学习。之前介绍的有监督学习需要大量的ground truth。

在这里插入图片描述
一个自编码器由编码器,隐藏层和解码器组层。编码器和解码器都可以用神经网络建模。可以不止一层,也可以是其他网络来进行建模(CNN, RNN等)
自编码器的目标是使得 h h h 能很好的编码 x x x 中的信息, x ^ \hat{x} x^ 是从 h h h 中重建出来的信息,希望 x x x x ^ \hat{x} x^ 尽量的接近,因此构造损失函数(举例):

? ( x , x ^ ) = ∥ x ? x ^ ∥ 2 2 \ell(\mathbf{x}, \hat{\mathbf{x}})=\|\mathbf{x}-\hat{\mathbf{x}}\|_{2}^{2} ?(x,x^)=x?x^22?

x x x x ^ \hat{x} x^ 之间越接近,说明 h h h 保留 x x x 中的信息保留的越好。
自编码器中编码器和解码器都可以用更复杂的结构进行替代建模。

自编码器中需要注意的问题:神经网络的表达能力太强的话,也不一定是好事。因为目标是为了使 h h h 尽可能保留 x x x 的信息,但又不希望 x x x x ^ \hat{x} x^ 完全一样,所以通常在 h h h 上加一个“信息瓶颈”,过滤掉不那么重要的信息,保留重要信息。
在这里插入图片描述
比如,常见的限制有降低 h h h 的维度,使 h h h 的维度小于输入的维度(欠完备的自编码器);对 h h h 加上一个正则化项,限制2范数大小(正则化的自编码器).

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-17 16:23:46  更:2022-07-17 16:24:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 0:33:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码