[人工智能] Pytorch动手学深度学习-多层感知机的简洁实现-代码理解

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Pytorch动手学深度学习-多层感知机的简洁实现-代码理解 -> 正文阅读

[人工智能]Pytorch动手学深度学习-多层感知机的简洁实现-代码理解

训练集、测试集均为FashionMNIST数据， $b a t c h s i z e = 256$ , $e p o c h e s = 10$ , $l r = 0.8$

代码部分



from torchvision.transforms import transforms
import torch
from torch import nn
from torch.nn import init
import numpy as np
import torchvision
#============================================
class FlattenLayer(torch.nn.Module):
  '''
  将输入的图片维度进行转变shape(256,100,100,3)->shape(256,3*100*100)
  '''
  def __init__(self):
    super(FlattenLayer,self).__init__()
  def forward(self,X):## x shape: (batch, *, *, ...)
    return X.view(X.shape[0],-1)
#===================================================
def load_data_fashion_mnist(batch_size,resize=None,root="~/Datasets/FashionMNIST"):
  '''
  下载数据集，返回两个批量数据迭代器，train_iter,test_iter
  '''
  #trans是用来保存，你要对数据进行的操作，如果resize,那么保存一个resize操作，然后进行一个ToTensor操作，因为直接下载下来的数据集不是Tensor类型的
  trans = []
  if resize:
    trans.append(torchvision.transforms.Resize(size=resize))
  trans.append(torchvision.transforms.ToTensor())
  #这里用来接受上边的trans，要传入数据集里
  transform = torchvision.transforms.Compose(trans)
  mnist_train = torchvision.datasets.FashionMNIST(root=root,train=True,download=True,transform=transform)
  mnist_test  = torchvision.datasets.FashionMNIST(root=root,train=False,download=True,transform=transform)
  #这里DataLoader是用来来创建一个读取小批量数据样本的DataLoader实例,通过参数num_workers来设置4个进程读取数据
  train_iter = torch.utils.data.DataLoader(mnist_train,batch_size=batch_size,shuffle=True,num_workers=4)
  test_iter = torch.utils.data.DataLoader(mnist_test,batch_size=batch_size,shuffle=True,num_workers=4)


  return train_iter,test_iter
#=====================================================
def evaluate_accuracy(data_iter,net,device = torch.device("cuda" if torch.cuda.is_available() else "cpu")):
  '''
    对测试集进行训练，计算准确率
  '''
  acc_sum, n = 0.0, 0
  with torch.no_grad():
    #每次从迭代器中，读取一个批量的图像数据以及对应的标签
    for a_batchsize_imagedata,a_batchsize_labeldata in data_iter:
      #如果net是右边的一个子类，执行
      if isinstance(net,torch.nn.Module):
        net.eval()#评估模式,batch normalization，Drop不起用
        a_batchsize_labeldata_hat = net(a_batchsize_imagedata.to(device))
        #a_batchsize_labeldata_hat.argmax(dim=1)是用来求出矩阵每行最大值的索引，其实就是预测最大值，与正常的标签最对比，就可求出准确率
        acc_sum += (a_batchsize_labeldata_hat.argmax(dim=1)==a_batchsize_labeldata.to(device)).float().sum().item()
        net.train()#训练模式，batch normalization，Drop启用
      n += a_batchsize_labeldata.shape[0]
  return acc_sum/n
#====================================================
def train(num_epoch,train_iter,test_iter,net,loss,optimizer):
  '''
    训练数据
  '''
  for epoch in range(num_epoch):
    train_loss_sum,train_acc_sum,n = 0.0,0.0,0
    for a_batchsize_imagedata,a_batchsize_labeldata in train_iter:
       a_batchsize_labeldata_hat = net(a_batchsize_imagedata)
       l = loss(a_batchsize_labeldata_hat,a_batchsize_labeldata).sum()
       #梯度清零
       if optimizer is not None:
         optimizer.zero_grad()
       #反向传播，进行梯度下降
       l.backward()
       #更新所有参数
       optimizer.step()
       train_loss_sum += l.item()
       train_acc_sum += (a_batchsize_labeldata_hat.argmax(dim=1)==a_batchsize_labeldata).sum().item()
       n += a_batchsize_labeldata.shape[0]
    test_acc = evaluate_accuracy(test_iter,net)
    print("epcoch {:}  loss {:.4f}% train_acc {:.4f}% test_acc {:.4f}%".format(epoch+1,train_loss_sum/n*100,train_acc_sum/n*100, test_acc*100))    


#=========================================================================


num_inputs, num_outputs, num_hiddens = 784, 10 ,256
#建立网络模型，网络按照容器内的结构进行排列
net = nn.Sequential(
    FlattenLayer(),
    nn.Linear(num_inputs,num_hiddens),
    nn.ReLU(),
    nn.Linear(num_hiddens,num_outputs)
)
for params in net.parameters():
  #从给定均值和标准差的正态分布N(mean, std)中生成值，填充输入的张量或变量
  init.normal_(params,mean=0,std=0.01)
batchsize=256
train_iter, test_iter = load_data_fashion_mnist(batch_size=batchsize)
loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(params=net.parameters(),lr=0.8)
num_epochs= 10
#启动训练与评估
train(num_epochs,train_iter,test_iter,net,loss,optimizer)

测试结果

epcoch 1 loss 0.7313% train_acc 58.3450% test_acc 67.6800%
epcoch 2 loss 0.2502% train_acc 75.6733% test_acc 75.2200%
epcoch 3 loss 0.2038% train_acc 80.6483% test_acc 79.9600%
epcoch 4 loss 0.1696% train_acc 84.2433% test_acc 83.8300%
epcoch 5 loss 0.1590% train_acc 85.0917% test_acc 82.2700%
epcoch 6 loss 0.1482% train_acc 86.1000% test_acc 85.0800%
epcoch 7 loss 0.1425% train_acc 86.5967% test_acc 82.5100%
epcoch 8 loss 0.1367% train_acc 87.1317% test_acc 82.9800%
epcoch 9 loss 0.1334% train_acc 87.3833% test_acc 85.7100%
epcoch 10 loss 0.1292% train_acc 87.8100% test_acc 85.1500%

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-10-07 13:51:15 更:2021-10-07 13:53:27

360图书馆购物三丰科技阅读网日历万年历 2025年10日历

-2025/10/2 10:45:56-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码