IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 双目3D感知(一):双目初步认识 -> 正文阅读

[人工智能]双目3D感知(一):双目初步认识

双目3D感知(一):双目初步认识

优势:

  • 单目3D感知依赖于先验知识和几何约束
  • 深度学习的算法非常依赖于数据集的规模、质量以及多样性
  • 双目系统解决了透视变换带来的歧义性
  • 双目感知不依赖于物体检测的结果,对任意障碍物均有效

劣势:

  • 硬件:摄像头需要精确配准,车辆运行过程中也要始终保持配准的正确性
  • 软件:算法需要同时处理来自两个摄像头的数据,计算复杂度较高

双目深度估计

请添加图片描述

基本原理

1.概念和公式
  • B:基线长度(两个相机之间的距离)

  • f:相机的焦距

  • d:视差(左右两张图像上同一个3D点之间的距离)

  • f和B是固定的,要求解深度z,只需估计视差d(xl-xr)

根 据 相 似 三 角 形 , 得 到 { f / z = x l / x f / z = x r / x ? B 只 有 x 和 z 是 未 知 变 量 根据相似三角形,得到\begin{cases} f/z=xl/x\\ f/z=xr/x-B \end{cases} \\ 只有x和z是未知变量 {f/z=xl/xf/z=xr/x?B?xz

得到下列式子:

Z = f B / d Z=fB/d Z=fB/d

2.视差估计:对于左图中的每个像素点。需要找到右图中与其匹配的点。
  • 对于每个可能的视差(范围有限),计算匹配误差,因此得到的三维误差数据称为Cost Volume。、
  • 计算匹配误差时考虑像素点附近的局部区域,比如对局部区域内所有对应像素值的差进行求和。
  • 通过Cost Volume可以得到每个像素处的视差(对应最小匹配误差的),从而得到深度值。

请添加图片描述

双目深度估计的关键是计算匹配误差
计算匹配的误差的关键是特征提取

PSMNET

1.左右图像上采用共享的卷积网络进行特征提取
  • 包括下采样,金字塔结构和空洞卷积来提取多分辨率的而信息并扩大感受野
2.左右特征图构建Cost Volume
3.3D卷积提取左右特征图以及不同视差级别之间的信息
4.上采样到原始分辨率,找到匹配误差最小的视差值
5.过程

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

6.结果分析(KITTI数据集)

  • 物体和背景上出现误差
    请添加图片描述

原因分析:虽然特征包含了邻域信息,但是缺乏高层语义信息的监督信号,无法理解场景。

改进方法:用物体检测和语义分割的结果进行后处理,或者多个任务

  • 距离过长出现的误差

请添加图片描述

距离0-10m10-30m30-60m60-inf0-inf
深度误差(RMSE)0.2681.2036.05616.6042.605

原因分析:远距离的视差值较小,在离散的图像像素上难以区分
Z = f B / d Z=fB/d Z=fB/d
改进方法:①提高图像的空间分辨率(长焦),使得远距离物体也有较多的像素覆盖

②增加基线长度,从而增加视差的范围

  • 低纹理或者低光照的区域,深度估计误差较大

请添加图片描述

原因分析:在该区域内无法有效提取特征,用于计算匹配误差

改进方法:提高摄像头的动态范围,或者采用可以测距的传感器

具体的仿真过程记录在下一篇里面有。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-25 18:06:59  更:2022-06-25 18:10:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 2:42:20-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码