IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 点云 3D 语义分割 - SqueezeSegV1、SqueezeSegV2、SqueezeSegV3 -> 正文阅读

[人工智能]点云 3D 语义分割 - SqueezeSegV1、SqueezeSegV2、SqueezeSegV3

1. SqueezeSegV1 简介

1.1 文章信息

(1)标题:SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud (2018)

(2)文章链接:https://arxiv.org/pdf/1710.07368.pdf

(3)文章代码:https://github.com/BichenWuUCB/SqueezeSeg

1.2 算法特点

速度快

1.3 算法摘要

在本文中,我们讨论了从 3D LiDAR 点云中对道路对象进行语义分割的问题。特别是,我们希望检测和分类感兴趣的实例,例如汽车、行人和骑自行车的人。我们将该问题描述为一个逐点分类问题,并提出了一种基于卷积神经网络(CNN)的端到端管道称为 SqueezeSeg:CNN 将转换后的 LiDAR 点云作为输入,直接输出逐点标签匹配,然后通过一个条件随机场(CRF)进行细化,该随机场作为一个循环层来实现。然后通过传统的聚类算法获得实例级标签。我们的 CNN 模型是在 KITTI 数据集中的 LiDAR 点云上训练的,我们的逐点分割标签来自 KITTI 的 3D 边界框。为了获得额外的训练数据,我们在流行的视频游戏《侠盗猎车手V》(GTA-V)中构建了一个 LiDAR 模拟器,以合成大量真实的训练数据。我们的实验表明,SqueezeSeg 以惊人的速度和稳定的运行时间(每帧8.7±0.5毫秒)实现了高精度,非常适合自动驾驶应用。此外,对合成数据的额外培训可以提高对真实数据的验证准确性。我们的源代码和合成数据将是开源的。

在这里插入图片描述

在这里插入图片描述

1.4 参考资料

参考文章原文和源代码,走读一遍,大概就清楚了,以下参考也可以了解。

参考资料

2. SqueezeSegV2 简介

2.1 文章信息

(1)标题:SqueezeSegV2: Improved Model Structure and Unsupervised Domain Adaptation for Road-Object Segmentation from a LiDAR Point Cloud (2019)

(2)文章链接:https://arxiv.org/pdf/1809.08495v1.pdf

(3)文章代码:https://github.com/xuanyuzhou98/SqueezeSegV2

2.2 算法特点

速度较快、精度较高

2.3 算法摘要

早期的工作证明了基于深度学习的点云分割方法的前景;然而,这些方法需要加以改进,以便实际有用。为此,我们介绍了一种新的模型SqueezeSegV2,该模型对 LiDAR 点云中的衰减噪声更具鲁棒性。凭借改进的模型结构、训练损失、批量标准化和额外的输入通道,SqueezeSegV2 在真实数据上训练时实现了显著的精度提高。用于点云分割的训练模型需要大量标记的点云数据,获取这些数据非常昂贵。为了避免收集和标注的成本,可以使用 GTA-V 等模拟器创建无限量的标记合成数据。然而,由于领域转移,基于合成数据训练的模型往往不能很好地推广到现实世界。我们通过一个域自适应训练管道来解决这个问题,该管道由三个主要部分组成:1) 学习强度渲染,2)测地线相关对齐,3)渐进域校准。当在真实数据上进行训练时,我们的新模型显示分割精度比原来的 SqueezeSeg 提高了6.0-8.6%。当我们使用提出的领域适应管道在合成数据上训练我们的新模型时,我们对真实数据的测试精度几乎翻了一番,从29.0%到57.4%。我们的源代码和合成数据集将是开源的。

在这里插入图片描述

2.4 参考资料

参考文章原文和源代码,走读一遍,大概就清楚了,以下参考也可以了解。

参考资料

3. SqueezeSegV3 简介

3.1 文章信息

(1)标题:Squeezesegv3: Spatially-adaptive convolution for efficient point-cloud segmentation (2020)

(2)文章链接:https://arxiv.org/pdf/2004.01803.pdf

(3)文章代码:https://github.com/chenfengxu714/SqueezeSegV3

3.2 算法特点

精度高

3.3 算法摘要

LiDAR 点云分割是许多应用中的一个重要问题。对于大规模点云分割,实际的方法是投影一个3D点云,得到一个2D LiDAR 图像,并使用卷积进行处理。尽管常规 RGB 图像和 LiDAR 图像之间存在相似性,但我们发现,在不同的图像位置,LiDAR 图像的特征分布会发生剧烈变化。使用标准卷积来处理这样的 LiDAR 图像是有问题的,因为卷积滤波器会拾取仅在图像中特定区域中活动的局部特征。因此,网络的能力没有得到充分利用,分割性能下降。为了解决这个问题,我们提出了空间自适应卷积(SAC),根据输入图像的不同位置采用不同的滤波器。SAC 可以高效地计算,因为它可以实现为一系列元素级乘法、im2col 和标准卷积。这是一个总体框架,因此之前的几种方法可以被视为 SAC 的特例。使用 SAC,我们构建了用于 LiDAR 点云分割的 SqueezeSegV3,并在 SemanticKITTI 基准上以相当的推理速度比所有先前发布的方法至少高出 3.7% 的 mIoU。

在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-10 22:31:02  更:2022-03-10 22:31:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 16:57:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码