IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【点云系列】PnP-3D: A Plug-and-Play for 3D Point Clouds -> 正文阅读

[人工智能]【点云系列】PnP-3D: A Plug-and-Play for 3D Point Clouds


最近终于有时间看看论文了,有时间看论文真的是一件幸福的事情,又可以输入了。

1. 概要

所述期刊会议:TPAMI顶刊2021年,仅8页内容
代码:https://github.com/ShiQiu0419/pnp-3d

2. 动机

提供一个即插即用的增强特征表达模块,增强现有点云分析网络的有效性,本质就是

  • 提供一个具有可增强现有网络且轻便的特征表达,具有通用性。
  • 增强性:局部几何&特征信息 (着重在几何关联性上)
  • 轻便性: 全局双边正则化(类似attention的剪枝版本)
  • 通用性: 点云分类、点云语义分割、物体检测

下图是一个直观的效果
在这里插入图片描述

3. 方法

下面是提出方法的网络架构,主要就是包括两部分:局部内容融合+全局双边正则化
在这里插入图片描述

3.1 局部内容融合

目的:基于3D空间几何关联性来融合局部几何特征内容
做法: 分了两个分支,对局部几何特征内容分别进行关联性编码,最后拼接。

3.1.1 局部几何分支:

目的:位置的编码可以提供一定的顺序的信息;
在这里插入图片描述
这个过程当中,包括三步骤:

  1. 使用DGCNN (EdgeConv)生成最近邻KNN
    如下公式所示,任一点 p i p_i pi?的K个近邻表示为 N ( p i ) \mathcal{N}(p_i) N(pi?)
    在这里插入图片描述
  2. 构建局部几何图
    该步骤就是所提方法的核心所在,针对每个点 p i p_i pi?,其局部几何图包括了其本身以及其与其近邻的差异 p i k ? p i p_{i_k}-p_i pik???pi?,因此整体就表示为 [ p i ; p i k ? p i ] [p_i;p_{i_k}-p_i] [pi?;pik???pi?],因为包含两个部分,每个部分是3通道,加上有k个近邻,一共就是kx6维度的信息输入;
    然后所有点的全局几何图就表示为 P ~ \mathcal{\tilde{P}} P~
    在这里插入图片描述
  3. 编码几何图
    这里就是类似常规PointNet操作了,对于 P ~ \mathcal{\tilde{P}} P~进行1x1大小的MLP+BN+ReLu后,再经过maxpooling获取最大的那个来表示整体的局部的几何信息;
    在这里插入图片描述

3.1.2 特征内容分支:

在这里插入图片描述

目的:提取特征
这里其实和3.1.1是一样的步骤,唯一的区别就是这里是针对特征做的,而上面是针对点做的。所以直接列公式了:
MLP是与上面3.1.1共享的。
在这里插入图片描述

3.1.3 聚合

融合几何3.1.1与特征内容3.1.2的信息在一起。
在这里插入图片描述

在这里插入图片描述

3.1.4 代码实现

定义:
在这里插入图片描述
实现:
在这里插入图片描述

3.2 全局双边正则化

目的:增强特征表达性。
做法:先分为基于点的和基于通道的特征信息,然后进行正则化聚合,形成最后的表达。
在这里插入图片描述

3.2.1 基于通道的信息 (channel-wise)

在这里插入图片描述
本质就是学习特征对于每个通道的权重,然后用平均结果表示,公式如下:
其实和attetention效果基本一致,唯一的区别在于这里没有用到所有通道,而是用了 C r \frac{C}{r} rC?个通道。这里 r > 2 r>2 r>2,是一个reduction因子,主要就是为了削减输出维度,在实验当中使用了8,因为这样减少了计算量,所以比attention要轻便很多。具体操作也是:1. 先矩阵相乘;2. RELU激活;3. 平均池化求解,得到 g c g_c gc?

公式解析:这里的 W c \mathbf{W_c} Wc?就是一个权值矩阵,ReLu的作用一个是提供非线性的作用,另一个就是满足输出是非负的,这个要求来自公式(6)。其实呢,也就是用来一个1维卷积,输入是 F L \mathcal{F}_L FL?,输出是 F L W c \mathcal{F}_L\mathbf{W}_c FL?Wc?,涉及到的仅仅是维度的变化。
在这里插入图片描述

3.2.2 基于点的信息 (point-wise)

在这里插入图片描述

操作与基于通道的一致,直接列公式:
在这里插入图片描述

3.2.3 聚合

在这里插入图片描述

这里用到了 1. 先进行外积操作;然后2. 求平方根,如公式(6)所示;
然后由公式(8)得到 F G \mathcal{F}_G FG?的表达;
最后的输出是公式(9),其的含义在:
在这里插入图片描述
公式(8):这是参考[42],加入了两个链接。
公式(9):需要更加具有区分性和代表性的特征输出,而公式(8)由于是从平均值中得到的,其表示了通常模式,可以被滤掉。因此最终的输出特征是过滤掉常用模式的具有区分性的特征图。

3. 2. 4 代码实现

这里就是对应的两个卷积,维度发生了变化,这里的8对应文中的 r r r
定义:
在这里插入图片描述
实现:
在这里插入图片描述

4. 效果

4.1 分类

输入:1024个点
其中测试的RS-CNN+PnP-3D与PointNet++ + PnP-3D:均在每个SA层之后加入PnP-3D。
剩余的则是在每个卷积块之后加入PnP-3D
在这里插入图片描述

4.2 语义分割

在这里插入图片描述

4.3 目标检测

在这里插入图片描述

4.4 与现有针对任务的基准线的比对

在这里插入图片描述

4.5 消融实验-公式

图4:针对公式4、5、9的消融实验,可以发现全部使用平均池化与 相减的策略是最佳的。
图5: 针对最后聚合的公式,发现几何平均是最优的。
在这里插入图片描述
在这里插入图片描述

4.6 消融实验-attention

在这里插入图片描述

4.7 可视化

增强的效果说实话,像是边缘增上的增强,但又没有那么的明显。
在这里插入图片描述
这里主要再说,使用了所提出的模块,位于在核心部位。
在这里插入图片描述

5. 思考

整体方法确实蛮简单的,但是简单有效。实验是真的充分,代码很简单。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-23 10:50:39  更:2022-04-23 10:51:38 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 9:37:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码