IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 25李沐动手学深度学习v2/填充和步幅 -> 正文阅读

[人工智能]25李沐动手学深度学习v2/填充和步幅

填充相同的高度和宽度,在所有侧边添加1个像素

import torch
from torch import nn

def comp_conv2d(conv2d,X):
    # 所有侧边添加1个像素
    X=X.reshape((1,1)+X.shape)
    Y=conv2d(X)
    # torch.Size([1, 1, 8, 8]) 1 通道数,1 batch_size
    Y.shape
    return Y.reshape(Y.shape[2:])

# 1输入通道数,1输出通道数,核大小3*3。padding是超参数,padding=1,上下左右都1像素
conv2d=nn.Conv2d(1,1,kernel_size=3,padding=1)
X=torch.rand(size=(8,8))
# 8+2-3+1=8,8+2-3+1=8
comp_conv2d(conv2d,X).shape
torch.Size([8, 8])

填充不同的高度和宽度

# padding 上下各2行 左右各1列
conv2d=nn.Conv2d(1,1,kernel_size=(5,3),padding=(2,1))
# 8+2+2-5+1=8,8+1+1-3+1=8
comp_conv2d(conv2d,X).shape
torch.Size([8, 8])

步幅的宽度和高度都是2

conv2d=nn.Conv2d(1,1,kernel_size=3,padding=1,stride=2)
# (8+1+1-3+2)/2=4,(8+1+1-3+2)/2=4
comp_conv2d(conv2d,X).shape
torch.Size([4, 4])
conv2d=nn.Conv2d(1,1,kernel_size=(3,5),padding=(0,1),stride=(3,4))
# (8+0+0-3+3)/3=2,(8+1+1-5+4)/4=2
comp_conv2d(conv2d,X).shape
torch.Size([2, 2])

总结

  • padding,防止输出shape太小
  • stride,防止输出shape太大
  • (输入行数+padding*2-kernel行数+stride)/stride
  • 通常,填充总量=核-1

query

超参数,核大小 填充 步幅 影响力大小

  • 答:通常,填充总量=核-1
  • 答:通常,步幅=1,最好,可以看到更多的东西
  • 答:不想要深的网络,通常,步幅=2

构造深度为100层的神经网络

  • 答:224x224的输入,把5个步幅为2的卷积层插到神经网络中即可

为什么卷积核的边长取奇数的多

  • 答:通常,填充总量=核-1。填充之后不改变对称性

核大小 填充 步幅超参数调节

  • 答:神经网络架构已经确定了这些超参数,一般不用调节

使用经典的网络结构

  • 答:对的,优先考虑ResNet系列,参照经典网络做改变

使用小的卷积核,视野小

  • 答:卷积核虽然小,但是每次看一局部信息,进而综合了局部信息,当神经网络很深时,往上抽象看到了全局信息

让超参数也一起参与学习

  • 答:NAS,现在是有钱人的游戏

多层卷积后信息丢失

  • 答:机器学习相当于极端压缩算法,一定会丢失信息的,抽象算法

多层3x3卷积类似于少层5x5卷积

  • 答:效果类似,但计算量随着卷积核变大而指数增加

简单的神经网络

  • 答:更容易流行。使用固定大小的核更简单

纹理特征

  • 答:不同的卷积核提取不同的纹理特征
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-21 00:29:07  更:2022-09-21 00:29:43 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 22:59:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码