[人工智能] 深度学习-torch-卷积神经网络

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 深度学习-torch-卷积神经网络 -> 正文阅读

[人工智能]深度学习-torch-卷积神经网络

一、基本概念
全连接神经网络：每相邻两个线性层之间的神经元都是全连接的神经网络。
在这里插入图片描述

卷积神经网络：保留数据原有特征情况下，对数据进行降维处理的网络模型。
经典的卷积神经网络有
1.LeNet
LeNet-5网络结构示意图
2.AlexNet
AlexNet网络结构示意图

3.VGG Net
4.GoogleNet
5.ResNet
6.MobileNet

二、卷积神经网络的基本组成部分
卷积层：用于特征提取
池化层：降维、防止过拟合
全连接层：输出结果

三、卷积层介绍
Output矩阵第一个元素是由Input矩阵中通过卷积核扫描到的第一个矩阵与卷积核进行数乘得到的结果：
在这里插入图片描述
用卷积核依次扫描Input矩阵做数乘，得到Output矩阵。（这里扫描的步长为1）
三通道的矩阵需要用到的卷积核是一个三维的张量，卷积核的三个矩阵分别对输入矩阵的三个通道进行扫描，然后将扫描结果进行相加，并且一轮扫描只能得到一个通道的矩阵输出：
（在我第一次学习的时候，我理解错了，以为是用一个二维矩阵作为三通道输入矩阵的卷积核，对三个通道的矩阵分别扫描做数乘，然后进行矩阵加法，得到Output矩阵）
在这里插入图片描述
卷积核用于过滤各个图像块，如果某一个图像块和当前的卷积核的卷积结果较大，那么可以认为该图像块和当前卷积核比较接近。
对于n通道的Input矩阵，它的卷积核是由n个二维矩阵组成的张量，形状是（n,k,k）,Output矩阵的通道数为1。
在这里插入图片描述

如果是想得到多通道矩阵的输出，那么需要多个卷积核对三通道的矩阵进行扫描。假设输入通道为n，输出通道为m，那么输入的卷积核的shape应为(m,n,k,k)
（卷积核和宽与高可以不等，但一般为方阵，便于计算）
在这里插入图片描述
输出结果为多通道矩阵用到的4维卷积核：

padding：为了保证输入矩阵和输出矩阵的大小保持一致，如果卷积核大小是33，需要进行一圈的填充；如果卷积核大小是55，需要进行两圈的填充。

代码：

import torch
#初始化一个列表，用于转化成Input矩阵
input=[1,2,3,4,5,
       6,3,4,7,2,
       3,4,6,8,9,
       2,9,7,4,3,
       3,4,3,7,1]

#将输入的列表通过view转化成张量，四个参数分别为（batch,channel,width,height）
input=torch.Tensor(input).view(1,1,5,5)

#定义一个卷积层，参数1,1分别为输出通道，输入通道
conv_layer=torch.nn.Conv2d(1,1,kernel_size=3,padding=1,stride=1,bias=False)

#定义一个输出通道为1，输入通道为1，大小为3*3的卷积核
kernel=torch.Tensor([1,2,3,4,5,6,7,8,9]).view(1,1,3,3)

#conv_layer.weight.data是一个张量
conv_layer.weight.data=kernel.data

#输出为一个张量
output=conv_layer(input)
print(output)

结果输出：
在这里插入图片描述
四、池化层介绍

import torch
#输入一个列表，用于转化成Input矩阵
input=[1,2,5,4,
       3,4,6,6,
       2,7,8,10,
       3,4,9,1]

#将输入的列表通过view转化成张量，四个参数分别为（batch,channel,width,height）
input=torch.Tensor(input).view(1,1,4,4)

#定义一个平均池化层，输出shape为2*2
#max_pooling=torch.nn.AdaptiveAvgPool2d((2,2))
#定义一个2*2的最大池化层
max_pooling=torch.nn.MaxPool2d(kernel_size=2)

#输出为一个张量
output=max_pooling(input)
print(output)