IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 经典网络模型介绍系列——LeNet-5 -> 正文阅读

[人工智能]经典网络模型介绍系列——LeNet-5

从今天开始,带大家从LeNet5开始学习经典的网络模型。

一、LeNet-5

LeNet-5是LeNet系列的最终稳定版,它被美国银行用于手写数字识别,该网络有以下特点

  • 所有卷积核大小均为5*5,步长为1;
  • 所有池化方法为平均池化;
  • 所有激活函数采用Sigmoid

1.输入层:输入图像的尺寸统一归一化为32*32.

2.C1层:第一个卷积层

  • 输入图片大小:32*32
  • 卷积核大小:5*5,步长1,无填充
  • 卷积核种类:6
  • 输出特征图大小:28*28? ? ? ? ? ? ? ? ?32-5+1=28
  • 神经元数量:28*28*6=4704
  • 可训练参数:(5*5+1)*6=156? ? ? ? ? ? ?其中,1为偏置参数
  • 连接数(和输入层的连接数):(5*5+1)*6*28*28=122304

3.S2层-池化层(下采样层)

  • 输入特征图大小:28*28
  • 采样区域:2*2
  • 采样方式:4个输入相加,乘以一个可训练参数,再加上一个可训练偏置。结果通过sigmoid函数。
  • 采样种类:6
  • 输出特征图大小:14*14
  • 神经元数量:14*14*6
  • 连接数(和C1层连接):(2*2+1)*6*14*14
  • S2中每个特征图的大小是C1中特征图大小的1/4.

4.C3层-第二个卷积层

  • 输入:S2中所有6个或者几个特征图组合
  • 卷积核大小:5*5
  • 卷积核种类:16
  • 输出特征图大小:10*10? ? ? ? 14-5+1=10
  • C3中的每个特征图是连接到S2中的所有6个或者几个特征图的,表示本层的特征图是上一层提取到的特征图的不同组合。存在的一个方式是:C3的前6个特征图以S2中3个相邻的特征图子集作为输入。接下来6个特征图以S2中4个相邻特征图自己为输入。然后的3个以不相邻的4个特征图子集作为输入。最后一个将S2中所有特征图作为输入。输出的16个通道并没有与输入的每个通道相连。这样设计的初衷有两个:
    • 1.减小计算量;
    • 2.打破对称性。
    • 现在的网络设计中,很少会遵循这样的设计原则。
  • 可训练参数:6*(3*5*5+1)+6*(4*5*5+1)+3*(4*5*5+1)+1*(6*5*5+1)=1516
  • 连接数:10*10*1516=151600

5.S4层-池化层(下采样层)

  • 输入:10*10
  • 采样区域:2*2
  • 采样方式:4个输入相加,乘以一个可训练参数,再加上一个可训练偏置。结果通过sigmoid函数。
  • 采样种类:16
  • 输出特征图大小:5*5
  • 神经元数量:5*5*16=400
  • 连接数:(2*2+1)*400=2000
  • S4中每个特征图的大小是C3特征图大小的1/4

6.C5层-第三个卷积层

  • 输入:5*5,即S4层的全部16个单元特征图(与S4全相连)
  • 卷积核大小:5*5
  • 卷积核种类:120
  • 输出特征图大小:1*1? ? ? ? (5-5+1)
  • 可训练参数:120*(16*5*5+1)=48120
  • 连接数:1*1*48120=48120
  • C5层是一个卷积层。由于S4层的16个图的大小为5*5,与卷积核的大小相同,所以卷积后形成的图的大小为1*1。这里形成120个卷积结果。每个都与上一层的16个图相连。所以共有(5*5*16+1)*120=48120个连接。

7.F6层-全连接层

  • 输入:120维向量
  • 输出:84维向量
  • 计算方式:计算输入向量和权重向量之间的点积,再加上一个偏置,结果通过sigmoid函数输出。
  • 可训练参数:84*(120+1)=10164

8.输出层-全连接层

  • 输入:84维向量
  • 输出:10维向量
  • 可训练参数:84*10,其中10就是分类的类别数。一共有10个节点,分别代表数字0到9,且如果节点i的值为0,则网络识别的结果是数字i。采用的是径向基函数(RBF)的网络连接方式。假设x是上一层的输入,y是RBF的输出,则RBF输出的计算方式是:

y_{i}=\sum_{j=1}^{n}(x_{j}-w_{ij})^{2}

下图是LeNet-5识别数字3的过程:

LeNet5的缺点:

输入图像太小,数据不足,在早期并没有在除手写数字识别之外的其他计算机视觉任务上取得大的突破。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-23 00:53:40  更:2022-06-23 00:54:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 3:51:54-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码