IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 立体匹配(视差估计)评价指标(MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D) -> 正文阅读

[人工智能]立体匹配(视差估计)评价指标(MiddleBurry、KITTI 2012、KITTI 2015、Scene Flow、ETH3D)

MiddleBurry 数据集:

评估区域

  • dics(Depth Discontinuity Region):视差不连续区域
  • all(All Region):全部区域
  • non-occ(Non-Occlusion Region):非遮挡区域

评估指标

  • bad δ D \delta_{D} δD? 1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\} N1?(x,y)N?{dest?(x,y)?dgt?(x,y)>δD?} :估计值与真实值相差大于 δ D \delta_{D} δD? 的像素的比例, δ D \delta_{D} δD? 可以取0.5、1.0、2.0、4.0
  • avgerr: 1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)| N1?(x,y)N?dest?(x,y)?dgt?(x,y) :平均绝对误差
  • rms: 1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ 2 \sqrt{\frac{1}{N} \sum_{(x, y)\in N}\left|d_{est}(x, y)-d_{gt}(x, y)\right|^{2}} N1?(x,y)N?dest?(x,y)?dgt?(x,y)2 ? :均方误差

KITTI 2012数据集:

??KITTI 2012 是真实驾驶场景的数据集,其包含194个训练图像对和195个测试图像对,图像分辨率为1226×370。该数据集提供了使用激光雷达获得的稀疏真实视差值。

评估区域

  • all(All Region):全部区域
  • non-occ(Non-Occlusion Region):非遮挡区域

评估指标

??若视差 ∣ d e s t ? e g t ∣ < δ D |d_{est}-e_{gt}|<\delta_{D} dest??egt?<δD?,则视为正确估计,阈值 δ D \delta_{D} δD?可为2,3,4,5

  • Out-Noc: δ D \delta_{D} δD? 1 N n o c ∑ ( x , y ) ∈ N n o c { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > δ D } \frac{1}{N_{noc}} \sum_{(x, y)\in N_{noc}}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\} Nnoc?1?(x,y)Nnoc??{dest?(x,y)?dgt?(x,y)>δD?} 非遮挡区域错误预测像素的比例
  • Out-All: δ D \delta_{D} δD? 1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > δ D } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\} Nall?1?(x,y)Nall??{dest?(x,y)?dgt?(x,y)>δD?}:全部区域错误预测像素的比例
  • Avg-Noc: 1 N n o c ∑ ( x , y ) ∈ N n o c ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ \frac{1}{N_{noc}}\sum_{(x,y)\in N_{noc}}|d_{est}(x,y)-d_{gt}(x,y)| Nnoc?1?(x,y)Nnoc??dest?(x,y)?dgt?(x,y) 非遮挡区域的端点误差(EPE-Noc)
  • Avg-All: 1 N a l l ∑ ( x , y ) ∈ N a l l ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ \frac{1}{N_{all}}\sum_{(x,y)\in N_{all}}|d_{est}(x,y)-d_{gt}(x,y)| Nall?1?(x,y)Nall??dest?(x,y)?dgt?(x,y) 全部区域的端点误差(EPE)

KITTI 2015数据集:

??KITTI 2015是真实驾驶场景的数据集。KITTI 2015包含200个训练图像对和200个测试图像对,图像分辨率为1242×375,该数据集提供了使用激光雷达获得的稀疏地面真实视差值。

评估图像

  • D1:评估第一帧图像
  • D2:评估第二帧图像

评估区域

  • bg(Background Regions):背景区域
  • fg(Foreground Regions):前景区域
  • all(All Region):全部区域

评估指标

??若视差或流端点误差 ∣ d e s t ? d g t ∣ < 3 |d_{est}-d_{gt}|<3 dest??dgt?<3px或 ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ d g t < 5 % \frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}<5\% dgt?dest?(x,y)?dgt?(x,y)?<5%则视为正确估计

  • D1-bg:对于第一帧图像,背景区域(background regions)预测正确的像素的比例

  • D1-fg:对于第一帧图像,前景区域(foreground regions)预测正确的像素的比例

  • D1-all:对于第一帧图像,所有区域(all regions)预测正确的像素的比例

  • D2-bg:对于第二帧图像,背景区域(background regions)预测正确的像素的比例

  • D2-fg:对于第二帧图像,前景区域(foreground regions)预测正确的像素的比例

  • D2-all:对于第二帧图像,所有区域(all regions)预测正确的像素的比例


Scene Flow数据集:

??Scene Flow是利用软件渲染生成的虚拟立体数据集,包含35454个训练图像对和4370个测试图像对,分辨率为960×540,该数据集提供稠密的视差图真实值。

??若视差或流端点误差 ∣ d e s t ? d g t ∣ < 3 |d_{est}-d_{gt}|<3 dest??dgt?<3px或 ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ d g t < 5 % \frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}<5\% dgt?dest?(x,y)?dgt?(x,y)?<5% 则视为正确估计

  • EPE: 1 N ∑ ( x , y ) ∈ N ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ \frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)| N1?(x,y)N?dest?(x,y)?dgt?(x,y) :全部区域的端点误差(EPE)
  • >1px: 1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > 1 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>1\} Nall?1?(x,y)Nall??{dest?(x,y)?dgt?(x,y)>1}:预测误差大于1px的像素的比例
  • >2px: 1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > 2 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>2\} Nall?1?(x,y)Nall??{dest?(x,y)?dgt?(x,y)>2}:预测误差大于2px的像素的比例
  • >3px: 1 N a l l ∑ ( x , y ) ∈ N a l l { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > 3 } \frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>3\} Nall?1?(x,y)Nall??{dest?(x,y)?dgt?(x,y)>3}:预测误差大于3px的像素的比例
  • D1:对于第一帧图像,预测正确的像素的比例

ETH3D数据集:

??ETH3D是室内和室外场景中的灰度立体数据集。其包含27个训练图像对与20个测试图像对,该数据集带有稀疏的视差真实值。视差范围在0-64之间。
评估指标

  • bad δ D \delta_{D} δD? 1 N ∑ ( x , y ) ∈ N { ∣ d e s t ( x , y ) ? d g t ( x , y ) ∣ > δ D } \frac{1}{N} \sum_{(x, y)\in N}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\} N1?(x,y)N?{dest?(x,y)?dgt?(x,y)>δD?} :估计值与真实值相差大于 δ D \delta_{D} δD? 的像素的比例, δ D \delta_{D} δD? 可以取1.0、2.0
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-01 15:44:16  更:2022-05-01 15:47:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 8:57:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码