开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> 《超详细》小白如何用pycharm进行RMB识别（含模型建立，损失函数，优化函数与具体组合实现功能的具体流程） -> 正文阅读

[Python知识库]《超详细》小白如何用pycharm进行RMB识别（含模型建立，损失函数，优化函数与具体组合实现功能的具体流程）

目录

一、模型板块

模型构建经验总结

1. 在init函数中设定自己想要的卷积层和线性层

2.在forward函数中制定数据信息变化过程

基础模型 Module

init函数部分

?forward函数部分

Sequential模型（本项目并没有用到，但还是说一说）

一、模型板块

模型构建经验总结

1. 在init函数中设定自己想要的卷积层和线性层

self.conv1 = nn.Conv2d(输入层数, 输出层数, 卷积核大小)

self.fc1 = nn.Linear(层数*长*宽, 想要的数值)（最终目的是缩小为分类的种类数，但不能直接一步成，必须分成几次达成）

2.在forward函数中制定数据信息变化过程

先是依次进行以下操作，直到无法继续缩小图片信息为止（长宽不满足执行条件）

????????out = F.relu(self.conv1(x)) （长宽减少，层数增加） 
????????执行条件：满足卷积神将网络的计算公式：
        ????????  N=(W-F+2P)/S+1
??????????????????其中N：输出大小
???????????????   W：输入大小
????????????????  F：卷积核大小
???????? ???????? P：填充值的大小
??????????????????S：步长大小
????????out = F.max_pool2d(out, 2)  （长宽减半，层数不变）
????????执行条件：长宽为偶数

当无法继续缩小图片信息后，执行设定好的线性层即可。

基础模型 Module

如果你想做一个网络，需要先定义一个Class，继承 nn.Module（这个是必须的,所以先import torch.nn as nn，nn是一个工具箱，很好用) ?
这个Class里面主要写两个函数，一个是初始化的__init__函数，另一个是forward函数。

下面是使用 Module 的模板：

class 网络名字(nn.Module):
    def __init__(self, 一些定义的参数):
        super(网络名字, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.layer1 = nn.Linear(num_input, num_hidden)
        self.layer2 = nn.Sequential(...)
        ...
 
        定义需要用的网络层
 
    def forward(self, x): # 定义前向传播
        x1 = self.layer1(x)
        x2 = self.layer2(x)
        x = x1 + x2
        ...
        return x

init函数部分

1.? __init__里面就是定义卷积层及线性层，先得super()一下，给父类nn.Module初始化一下。在这个里面主要就是定义卷积层的，比如第一层，我们叫它conv1，把它定义成输入3通道，输出6通道，卷积核5*5的的一个卷积层。

2.? 而torch.nn.Linear就是神经网络中的线性层，可以实现形如y=Xweight^T+b的加和功能。

?forward函数部分

forward里面就是真正执行数据的流动。比如下面的代码，输入的x先经过定义的conv1，再经过激活函数F.relu()。下一步的F.max_pool2d池化也是一样的。在一系列流动以后，最后把x返回到外面去。

本项目的?forward函数部分如下：

    def forward(self, x):    #4 3 32 32 ->nn.Conv2d(3, 6, 5)->   4 6 28 28
        out = F.relu(self.conv1(x)) #32->28   4 6 28 28
        out = F.max_pool2d(out, 2)   #4 6 14 14
        out = F.relu(self.conv2(out)) # 4 16 10 10
        out = F.max_pool2d(out, 2)  # 4 16 5 5
        out = out.view(out.size(0), -1) #4 400
        out = F.relu(self.fc1(out))
        out = F.relu(self.fc2(out))
        out = self.fc3(out)
        return out

补充：池化与下采样的关系如下

下采样和池化应该是包含关系，池化属于下采样，而下采样不局限于池化，如果卷积 stride=2，此时也可以把这种卷积叫做下采样。

池化方法：1.? max-pooling：对邻域内特征点取最大值

? ? ? ? ? ? ? ? ? 2.? mean-pooling：对邻域内特征点求平均。?

池化作用：1.? 降维，减少网络要学习的参数数量

? ? ? ? ? ? ? ? ? 2.? 防止过拟合

? ? ? ? ? ? ? ? ? 3.? 扩大感受野

? ? ? ? ? ? ? ? ? 4.? 实现不变性（平移、旋转、尺度不变性）

Sequential模型（本项目并没有用到，但还是说一说）

概念：

类似于keras中的序贯模型，当一个模型较简单的时候，我们可以使用torch.nn.Sequential类来实现简单的顺序连接模型。
这个模型也是继承自Module类的。

特点：

? ? ?1. 具有顺序性，各网络层之间严格按照顺序执行。

?最简单的序贯模型


import torch.nn as nn
model = nn.Sequential(
                  nn.Conv2d(1,20,5),
                  nn.ReLU(),
                  nn.Conv2d(20,64,5),
                  nn.ReLU()
                )
 
print(model)
print(model[2]) # 通过索引获取第几个层
'''运行结果为：
Sequential(
  (0): Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  (1): ReLU()
  (2): Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  (3): ReLU()
)
Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
'''

注：这样做有一个问题，每一个层是没有名称，默认的是以0、1、2、3来命名，从上面的运行结果也可以看出。下文会给出如何给每一个层添加名称。

而其真正运用与项目时，代码举例如下：

class LeNetSequential(nn.Module):
    def __init__(self, classes):
        super(LeNetSequential, self).__init__()

        self.features = nn.Sequential(
            nn.Conv2d(3, 6, 5),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(6, 16, 5),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),)

        self.classifier = nn.Sequential(
            nn.Linear(16*5*5, 120),
            nn.ReLU(),
            nn.Linear(120, 84),
            nn.ReLU(),
            nn.Linear(84, classes),)

    def forward(self, x):
        x = self.features(x)
        x = x.view(x.size()[0], -1)
        x = self.classifier(x)
        return x

主要是起到了将顺序执行的多个网络层进行包装的作用。

给每一个层添加名称


import torch.nn as nn
from collections import OrderedDict
model = nn.Sequential(OrderedDict([
                  ('conv1', nn.Conv2d(1,20,5)),
                  ('relu1', nn.ReLU()),
                  ('conv2', nn.Conv2d(20,64,5)),
                  ('relu2', nn.ReLU())
                ]))
 
print(model)
print(model[2]) # 通过索引获取第几个层
'''运行结果为：
Sequential(
  (conv1): Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  (relu1): ReLU()
  (conv2): Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  (relu2): ReLU()
)
Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
'''

注意：从上面的结果中可以看出，这个时候每一个层都有了自己的名称，但是此时需要注意，我并不能够通过名称直接获取层，依然只能通过索引index，即

model[2] 是正确的

model["conv2"] 是错误的

而对于其在具体项目中的运用方式，也是差不多的。代码如下:

class LeNetSequentialOrderDict(nn.Module):
    def __init__(self, classes):
        super(LeNetSequentialOrderDict, self).__init__()

        self.features = nn.Sequential(OrderedDict({
            'conv1': nn.Conv2d(3, 6, 5),
            'relu1': nn.ReLU(inplace=True),
            'pool1': nn.MaxPool2d(kernel_size=2, stride=2),

            'conv2': nn.Conv2d(6, 16, 5),
            'relu2': nn.ReLU(inplace=True),
            'pool2': nn.MaxPool2d(kernel_size=2, stride=2),
        }))

        self.classifier = nn.Sequential(OrderedDict({
            'fc1': nn.Linear(16*5*5, 120),
            'relu3': nn.ReLU(),

            'fc2': nn.Linear(120, 84),
            'relu4': nn.ReLU(inplace=True),

            'fc3': nn.Linear(84, classes),
        }))

    def forward(self, x):
        x = self.features(x)
        x = x.view(x.size()[0], -1)
        x = self.classifier(x)
        return x

二、损失函数与优化函数

1.损失函数

代码如下（示例）：

criterion = nn.CrossEntropyLoss() # 提前选择好合适的损失函数

# 以下三行用于数据集的循环中对以每一个batch为单位进行的操作
optimizer.zero_grad()             # 用于清除现有梯度值，防止在循环中不断和之前计算得出的梯度累加
loss = criterion(outputs, labels) # 根据计算得出的outputs和已知的labels计算loss
loss.backward()                   # 调用backward函数，便于下一步的优化