IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> torch.argmax函数dim=None应用于高维矩阵的理解 -> 正文阅读

[人工智能]torch.argmax函数dim=None应用于高维矩阵的理解

在深度学习模型中经常会用到torch.argmax函数,网上对它的讲解多是针对指定dim参数的情况。但是最近遇到了一个dim=None的情况,不是很理解,查了半天也没找到相关的解释。自己写了个例子试了一下,大概理解了,记录一下,做个备忘。

import torch

# 随机生成一个4维矩阵
a = torch.rand((2, 2, 3, 4))
# 获取a矩阵的形状
b, d, w, h = a.shape
print(a)
# 获取a矩阵中最大值的索引
index = torch.argmax(a)
print(index)
# 获取最大值的z索引,z对应shape中的d
z = int(index // w // h)
index -= z * w * h
# 获取最大值的x索引,x对应shape中的w
x = int(index // h)
index -= x * h
# 获取最大值的y索引,y对应shape中的h
y = int(index)
# 打印z,x,y
print(z, x, y)

运行结果:

tensor([[[[0.2936, 0.2863, 0.5059, 0.4042],
          [0.9422, 0.4629, 0.8336, 0.0168],
          [0.9002, 0.8628, 0.3787, 0.9284]],

         [[0.5688, 0.2993, 0.3334, 0.9471],
          [0.4500, 0.1274, 0.1956, 0.6806],
          [0.8735, 0.5767, 0.8293, 0.3108]]],


        [[[0.3033, 0.8770, 0.2276, 0.4150],
          [0.2653, 0.9783, 0.2614, 0.9467],
          [0.4042, 0.8505, 0.0225, 0.4542]],

         [[0.8606, 0.3494, 0.1172, 0.4817],
          [0.1268, 0.2600, 0.1153, 0.6345],
          [0.7228, 0.9589, 0.2653, 0.5185]]]])
tensor(29)
2 1 1

首先生成了一个随机矩阵a,从矩阵a来看,最大值为0.9783.
其索引为(2, 1, 1)。torch.argmax(a)返回的index只有一个值29。下面理解一下29是怎么来的,首先对于矩阵a,其shape为(2, 2, 3, 4), 29=[2×(3×4)]+1×4+1×1=24+4+1
。可以理解为,对于d维度,必须满足w和h维度后,才有d维度;对于w维度,必须满足h维度后才有w维度;对于h维度,h维度就是单个的数。

这么讲可能讲不太清楚,可结合256 = 2×100+5×10+6×1来理解,其中100=10×10,也就是256=2×(10×10)+5×10+6×1。所以,通过上述代码,可在未指定dim时求解出整个矩阵最大值的具体索引。

这是对于不指定dim时的高维矩阵的情况,在指定dim时,网上有很多讲解的博客,这里就不记录了,想了解可以看这一篇博客

上述内容是个人理解,如有不对,欢迎指正!

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-05 11:19:11  更:2022-05-05 11:23:18 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/4 15:46:32-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码