IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Octree Transformer读书笔记 -> 正文阅读

[人工智能]Octree Transformer读书笔记

任务

用自回归的方式来生成三维形状(3D Shape)。

问题

(1)怎么压缩数据(在分辨率较高的时候会造成内存开销过大)

(2)如何以自回归的方式生成结果

方法

整个过程分为三个阶段,(1)输入一个八叉树序列。(2)将其压缩为一个短的序列。(3)训练一个标准的transformer解码器。当完成训练以后,可以利用transformer生成一个序列向量,并且解压解码。

序列化的八叉树

首先对一个体素化的shape,用一个包围盒(bounding cube)将其围住,并对其进行细分,每一次都划分8个小的cubes。当一个cube里面,全部为空时,就停止划分。重复以上过程,直到达到体素的分辨率为止。下一步,需要将这个结果序列化为一系列连续的token。

?作者以广度优先的方式,遍历八叉树,从而能够得到一个序列化的数据(对于每个cell,作者用1代表空,用2代表混合,用3代表全满)。在这里,作者增加了一种空间的编码方式,用来替代1维的位置编码,用到这种特殊的transformer中。如上图左边的图所示,在Y轴上按照分辨率进行了编码。在每一个坐标轴上,作者都进行了这一个操作。因此,对于每一个cell,就得到了4个不同的ID:v(c), px(c), py(c), pz(c)。v(c)代表一个cell本身的值,px(c)等代表在不同的坐标轴上对shape进行编码后得到的值。

【注】这种编码方式并不需要从生成模型中获取,可以直接基于他们自己的值进行推断。这种空间位置的编码方式来替代原来的PE是值得学习的点。

序列压缩

简单的将体素做一维的展开会带来极大的运算开销,因此作者对分层的八叉树做了特殊的展开。作者在压缩时,考虑了两个原则,首先,对于所有的cell,并不是公平考虑的,应该重点考虑细节上的cell。此外,应该空间上更接近的而不是序列上更接近的单元压缩在一起。

解码

解码的过程非常重要,首先,需要生成压缩的单元信息,其次,需要从生成的信息进行解压缩的操作。解压缩的过程,只利用简单的上采样是不够的,这会丧失自编码的属性。因此,作者首先对于一系列压缩的token,首先进行反卷积,得到上采样的结果,之后需要计算依赖关系。

思索

文章的idea不错,空间编码替代常规的PE非常的新颖,但是个人任务论文对于解码等很多细节的描述并不完善,导致无法进一步研究,论文也没有开源,进一步增加了研究的难度

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-07 12:01:51  更:2021-12-07 12:02:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 2:19:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码