IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习(2):卷积层的过程探究 -> 正文阅读

[人工智能]深度学习(2):卷积层的过程探究

对于pytorch框架而言,给出了三种卷积方式,分别是:

Conv1d、Conv2d、Conv3d

本文对于前两种卷积方式,进行探究,第三种依次类推

0.最基本的卷积模式理解

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ??

?假设蓝色是被卷积的矩阵,橙色是卷积核,那么沿着横向核纵向的卷积移动过程就如下所示

1.Conv1d?

一维的卷积,意思就是卷积核不像上面那样,它只会沿着一个方向移动卷积核,那么问题就来了:以3×3的数据为例子,进行一维的卷积过程是怎么样的呢?

(1) 对于一维卷积的卷积核,本质上是一个二维的小矩阵,这个矩阵大小如果表示为w×h的话,其特点是有一个维度是固定了大小的,假如是w被固定了,w具体大小要与被卷积数据的w一致,剩下的h就是需要我们进行设定的维度。

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ??

上图展示了设定卷积核尺寸为2的情况,卷积核的大小就会变成2*3的形状,随后沿着纵向进行卷积?

?(2)接下来就是代码层面的验证上面的原理了。

首先呢,我们定义一下测试数据以及卷积层:

import torch
import torch.nn as nn

data = torch.arange(0, 60, dtype=torch.float32).reshape(3, 4, 5)
con1 = nn.Conv1d(in_channels=4, out_channels=6, kernel_size=3)

下一步,我们查看卷积层参数的形状:参数分为2部分:

权重是[6, 4, 3],表示有6个卷积核,每个的形状是[4, 3]

偏置是6个,对应6个卷积核

for e in con1.parameters():
    print(e.shape)
"""
Weight: torch.Size([6, 4, 3])
Bias: torch.Size([6])
"""

下一步就是传入卷积层得到输出结果:

out = con1(data1)
print(out)
"""
tensor([[[ 9.5418e+00,  1.0264e+01,  1.0987e+01],
         [ 5.0055e+00,  5.5690e+00,  6.1324e+00],
         [ 5.8434e+00,  6.7361e+00,  7.6287e+00],
         [ 2.2538e-02, -3.9881e-01, -8.2016e-01],
         [ 2.7357e+00,  3.1719e+00,  3.6082e+00],
         [ 6.3507e+00,  6.5536e+00,  6.7565e+00]],

            .............

        [[ 3.8442e+01,  3.9164e+01,  3.9887e+01],
         [ 2.7543e+01,  2.8106e+01,  2.8670e+01],
         [ 4.1550e+01,  4.2443e+01,  4.3335e+01],
         [-1.6831e+01, -1.7253e+01, -1.7674e+01],
         [ 2.0186e+01,  2.0622e+01,  2.1059e+01],
         [ 1.4465e+01,  1.4668e+01,  1.4871e+01]]], grad_fn=<SqueezeBackward1>)

"""

随后我们来验证一下我们的原理,数据是3*4*5的尺寸,表示有3个4*5的二维数组,现在用第一个卷积核对它进行卷积:

res = con1.weight[0].mul(data1[0, :, 0:3]).sum() + con1.bias[0]
print(res)
"""
tensor(9.5418, grad_fn=<AddBackward0>)
"""

可以看到结果正是先前out结果的第一个值。

2.Conv2d?

2d的卷积层就顺理成章的可以理解了,它就是使用3维的卷积核进行卷积,但是也有一个维度的尺寸大小是锁定大小的,假设输入的是10张3通道的256×256RGB图像,那么数据的形状就是:? ? [10, 3, 256, 256]

(1)对于三维的卷积核,其关于通道维度的大小是锁定与图像的3通道数一致,因此需要设定的是沿着横向和纵向的尺寸,例如一个卷积核的大小可以为:[3, w, h],具体的w和h细节就再此不过多考虑。下图会演示卷积过程:数据为1*3*4*5,卷积核为3*3*3?

?

上图左右分别是数据与卷积核,垂直屏幕方向是通道维度。第一次卷积的位置如下所示?

可以看出卷积核还可以沿着横向和纵向方向移动?

?(2)接下来是代码层面进行验证原理

con2 = nn.Conv2d(in_channels=3, out_channels=6, kernel_size=3)
data2 = torch.rand(10, 3, 4, 5, dtype=torch.float32)
out = con2(data2)
print(out[0,0,0,0].detach().numpy())

res = data2[0, :, 0:3, 0:3].mul(con2.weight[0]).sum() + con2.bias[0]
print(res.detach().numpy())
"""
0.24863902
0.248639
"""

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-09 16:16:59  更:2021-10-09 16:17:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 13:56:54-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码