IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Pytorch动手学深度学习-多层感知机的简洁实现-代码理解 -> 正文阅读

[人工智能]Pytorch动手学深度学习-多层感知机的简洁实现-代码理解

训练集、测试集均为FashionMNIST数据, b a t c h s i z e = 256 batchsize=256 batchsize=256, e p o c h e s = 10 epoches=10 epoches=10, l r = 0.8 lr=0.8 lr=0.8

代码部分



from torchvision.transforms import transforms
import torch
from torch import nn
from torch.nn import init
import numpy as np
import torchvision
#============================================
class FlattenLayer(torch.nn.Module):
  '''
  将输入的图片维度进行转变shape(256,100,100,3)->shape(256,3*100*100)
  '''
  def __init__(self):
    super(FlattenLayer,self).__init__()
  def forward(self,X):## x shape: (batch, *, *, ...)
    return X.view(X.shape[0],-1)
#===================================================
def load_data_fashion_mnist(batch_size,resize=None,root="~/Datasets/FashionMNIST"):
  '''
  下载数据集,返回两个批量数据迭代器,train_iter,test_iter
  '''
  #trans是用来保存,你要对数据进行的操作,如果resize,那么保存一个resize操作,然后进行一个ToTensor操作,因为直接下载下来的数据集不是Tensor类型的
  trans = []
  if resize:
    trans.append(torchvision.transforms.Resize(size=resize))
  trans.append(torchvision.transforms.ToTensor())
  #这里用来接受上边的trans,要传入数据集里
  transform = torchvision.transforms.Compose(trans)
  mnist_train = torchvision.datasets.FashionMNIST(root=root,train=True,download=True,transform=transform)
  mnist_test  = torchvision.datasets.FashionMNIST(root=root,train=False,download=True,transform=transform)
  #这里DataLoader是用来来创建一个读取小批量数据样本的DataLoader实例,通过参数num_workers来设置4个进程读取数据
  train_iter = torch.utils.data.DataLoader(mnist_train,batch_size=batch_size,shuffle=True,num_workers=4)
  test_iter = torch.utils.data.DataLoader(mnist_test,batch_size=batch_size,shuffle=True,num_workers=4)


  return train_iter,test_iter
#=====================================================
def evaluate_accuracy(data_iter,net,device = torch.device("cuda" if torch.cuda.is_available() else "cpu")):
  '''
    对测试集进行训练,计算准确率
  '''
  acc_sum, n = 0.0, 0
  with torch.no_grad():
    #每次从迭代器中,读取一个批量的图像数据以及对应的标签
    for a_batchsize_imagedata,a_batchsize_labeldata in data_iter:
      #如果net是右边的一个子类,执行
      if isinstance(net,torch.nn.Module):
        net.eval()#评估模式,batch normalization,Drop不起用
        a_batchsize_labeldata_hat = net(a_batchsize_imagedata.to(device))
        #a_batchsize_labeldata_hat.argmax(dim=1)是用来求出矩阵每行最大值的索引,其实就是预测最大值,与正常的标签最对比,就可求出准确率
        acc_sum += (a_batchsize_labeldata_hat.argmax(dim=1)==a_batchsize_labeldata.to(device)).float().sum().item()
        net.train()#训练模式,batch normalization,Drop启用
      n += a_batchsize_labeldata.shape[0]
  return acc_sum/n
#====================================================
def train(num_epoch,train_iter,test_iter,net,loss,optimizer):
  '''
    训练数据
  '''
  for epoch in range(num_epoch):
    train_loss_sum,train_acc_sum,n = 0.0,0.0,0
    for a_batchsize_imagedata,a_batchsize_labeldata in train_iter:
       a_batchsize_labeldata_hat = net(a_batchsize_imagedata)
       l = loss(a_batchsize_labeldata_hat,a_batchsize_labeldata).sum()
       #梯度清零
       if optimizer is not None:
         optimizer.zero_grad()
       #反向传播,进行梯度下降
       l.backward()
       #更新所有参数
       optimizer.step()
       train_loss_sum += l.item()
       train_acc_sum += (a_batchsize_labeldata_hat.argmax(dim=1)==a_batchsize_labeldata).sum().item()
       n += a_batchsize_labeldata.shape[0]
    test_acc = evaluate_accuracy(test_iter,net)
    print("epcoch {:}  loss {:.4f}% train_acc {:.4f}% test_acc {:.4f}%".format(epoch+1,train_loss_sum/n*100,train_acc_sum/n*100, test_acc*100))    


#=========================================================================


num_inputs, num_outputs, num_hiddens = 784, 10 ,256
#建立网络模型,网络按照容器内的结构进行排列
net = nn.Sequential(
    FlattenLayer(),
    nn.Linear(num_inputs,num_hiddens),
    nn.ReLU(),
    nn.Linear(num_hiddens,num_outputs)
)
for params in net.parameters():
  #从给定均值和标准差的正态分布N(mean, std)中生成值,填充输入的张量或变量
  init.normal_(params,mean=0,std=0.01)
batchsize=256
train_iter, test_iter = load_data_fashion_mnist(batch_size=batchsize)
loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(params=net.parameters(),lr=0.8)
num_epochs= 10
#启动训练与评估
train(num_epochs,train_iter,test_iter,net,loss,optimizer)

测试结果

epcoch 1 loss 0.7313% train_acc 58.3450% test_acc 67.6800%
epcoch 2 loss 0.2502% train_acc 75.6733% test_acc 75.2200%
epcoch 3 loss 0.2038% train_acc 80.6483% test_acc 79.9600%
epcoch 4 loss 0.1696% train_acc 84.2433% test_acc 83.8300%
epcoch 5 loss 0.1590% train_acc 85.0917% test_acc 82.2700%
epcoch 6 loss 0.1482% train_acc 86.1000% test_acc 85.0800%
epcoch 7 loss 0.1425% train_acc 86.5967% test_acc 82.5100%
epcoch 8 loss 0.1367% train_acc 87.1317% test_acc 82.9800%
epcoch 9 loss 0.1334% train_acc 87.3833% test_acc 85.7100%
epcoch 10 loss 0.1292% train_acc 87.8100% test_acc 85.1500%

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-07 13:51:15  更:2021-10-07 13:53:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/22 2:49:54-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码