MiddleBurry 数据集:
评估区域:
- dics(Depth Discontinuity Region):视差不连续区域
- all(All Region):全部区域
- non-occ(Non-Occlusion Region):非遮挡区域
评估指标:
- bad
δ
D
\delta_{D}
δD?:
1
N
∑
(
x
,
y
)
∈
N
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
δ
D
}
\frac{1}{N} \sum_{(x, y)\in N}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\}
N1?∑(x,y)∈N?{∣dest?(x,y)?dgt?(x,y)∣>δD?} :估计值与真实值相差大于
δ
D
\delta_{D}
δD? 的像素的比例,
δ
D
\delta_{D}
δD? 可以取0.5、1.0、2.0、4.0
- avgerr:
1
N
∑
(
x
,
y
)
∈
N
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
\frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|
N1?∑(x,y)∈N?∣dest?(x,y)?dgt?(x,y)∣ :平均绝对误差
- rms:
1
N
∑
(
x
,
y
)
∈
N
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
2
\sqrt{\frac{1}{N} \sum_{(x, y)\in N}\left|d_{est}(x, y)-d_{gt}(x, y)\right|^{2}}
N1?∑(x,y)∈N?∣dest?(x,y)?dgt?(x,y)∣2
? :均方误差
KITTI 2012数据集:
??KITTI 2012 是真实驾驶场景的数据集,其包含194个训练图像对和195个测试图像对,图像分辨率为1226×370。该数据集提供了使用激光雷达获得的稀疏真实视差值。
评估区域:
- all(All Region):全部区域
- non-occ(Non-Occlusion Region):非遮挡区域
评估指标:
??若视差
∣
d
e
s
t
?
e
g
t
∣
<
δ
D
|d_{est}-e_{gt}|<\delta_{D}
∣dest??egt?∣<δD?,则视为正确估计,阈值
δ
D
\delta_{D}
δD?可为2,3,4,5
- Out-Noc:
δ
D
\delta_{D}
δD?:
1
N
n
o
c
∑
(
x
,
y
)
∈
N
n
o
c
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
δ
D
}
\frac{1}{N_{noc}} \sum_{(x, y)\in N_{noc}}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\}
Nnoc?1?∑(x,y)∈Nnoc??{∣dest?(x,y)?dgt?(x,y)∣>δD?} 非遮挡区域错误预测像素的比例
- Out-All:
δ
D
\delta_{D}
δD?:
1
N
a
l
l
∑
(
x
,
y
)
∈
N
a
l
l
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
δ
D
}
\frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\}
Nall?1?∑(x,y)∈Nall??{∣dest?(x,y)?dgt?(x,y)∣>δD?}:全部区域错误预测像素的比例
- Avg-Noc:
1
N
n
o
c
∑
(
x
,
y
)
∈
N
n
o
c
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
\frac{1}{N_{noc}}\sum_{(x,y)\in N_{noc}}|d_{est}(x,y)-d_{gt}(x,y)|
Nnoc?1?∑(x,y)∈Nnoc??∣dest?(x,y)?dgt?(x,y)∣ 非遮挡区域的端点误差(EPE-Noc)
- Avg-All:
1
N
a
l
l
∑
(
x
,
y
)
∈
N
a
l
l
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
\frac{1}{N_{all}}\sum_{(x,y)\in N_{all}}|d_{est}(x,y)-d_{gt}(x,y)|
Nall?1?∑(x,y)∈Nall??∣dest?(x,y)?dgt?(x,y)∣ 全部区域的端点误差(EPE)
KITTI 2015数据集:
??KITTI 2015是真实驾驶场景的数据集。KITTI 2015包含200个训练图像对和200个测试图像对,图像分辨率为1242×375,该数据集提供了使用激光雷达获得的稀疏地面真实视差值。
评估图像:
评估区域:
- bg(Background Regions):背景区域
- fg(Foreground Regions):前景区域
- all(All Region):全部区域
评估指标:
??若视差或流端点误差
∣
d
e
s
t
?
d
g
t
∣
<
3
|d_{est}-d_{gt}|<3
∣dest??dgt?∣<3px或
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
d
g
t
<
5
%
\frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}<5\%
dgt?∣dest?(x,y)?dgt?(x,y)∣?<5%则视为正确估计
-
D1-bg:对于第一帧图像,背景区域(background regions)预测正确的像素的比例 -
D1-fg:对于第一帧图像,前景区域(foreground regions)预测正确的像素的比例 -
D1-all:对于第一帧图像,所有区域(all regions)预测正确的像素的比例 -
D2-bg:对于第二帧图像,背景区域(background regions)预测正确的像素的比例 -
D2-fg:对于第二帧图像,前景区域(foreground regions)预测正确的像素的比例 -
D2-all:对于第二帧图像,所有区域(all regions)预测正确的像素的比例
Scene Flow数据集:
??Scene Flow是利用软件渲染生成的虚拟立体数据集,包含35454个训练图像对和4370个测试图像对,分辨率为960×540,该数据集提供稠密的视差图真实值。
??若视差或流端点误差
∣
d
e
s
t
?
d
g
t
∣
<
3
|d_{est}-d_{gt}|<3
∣dest??dgt?∣<3px或
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
d
g
t
<
5
%
\frac{{|d_{est}(x,y)-d_{gt}(x,y)|}}{d_{gt}}<5\%
dgt?∣dest?(x,y)?dgt?(x,y)∣?<5% 则视为正确估计
- EPE:
1
N
∑
(
x
,
y
)
∈
N
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
\frac{1}{N}\sum_{(x,y)\in N}|d_{est}(x,y)-d_{gt}(x,y)|
N1?∑(x,y)∈N?∣dest?(x,y)?dgt?(x,y)∣ :全部区域的端点误差(EPE)
- >1px:
1
N
a
l
l
∑
(
x
,
y
)
∈
N
a
l
l
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
1
}
\frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>1\}
Nall?1?∑(x,y)∈Nall??{∣dest?(x,y)?dgt?(x,y)∣>1}:预测误差大于1px的像素的比例
- >2px:
1
N
a
l
l
∑
(
x
,
y
)
∈
N
a
l
l
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
2
}
\frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>2\}
Nall?1?∑(x,y)∈Nall??{∣dest?(x,y)?dgt?(x,y)∣>2}:预测误差大于2px的像素的比例
- >3px:
1
N
a
l
l
∑
(
x
,
y
)
∈
N
a
l
l
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
3
}
\frac{1}{N_{all}} \sum_{(x, y)\in N_{all}}\{|d_{est}(x, y)-d_{gt}(x, y)|>3\}
Nall?1?∑(x,y)∈Nall??{∣dest?(x,y)?dgt?(x,y)∣>3}:预测误差大于3px的像素的比例
- D1:对于第一帧图像,预测正确的像素的比例
ETH3D数据集:
??ETH3D是室内和室外场景中的灰度立体数据集。其包含27个训练图像对与20个测试图像对,该数据集带有稀疏的视差真实值。视差范围在0-64之间。 评估指标:
- bad
δ
D
\delta_{D}
δD?:
1
N
∑
(
x
,
y
)
∈
N
{
∣
d
e
s
t
(
x
,
y
)
?
d
g
t
(
x
,
y
)
∣
>
δ
D
}
\frac{1}{N} \sum_{(x, y)\in N}\{|d_{est}(x, y)-d_{gt}(x, y)|>\delta_{D}\}
N1?∑(x,y)∈N?{∣dest?(x,y)?dgt?(x,y)∣>δD?} :估计值与真实值相差大于
δ
D
\delta_{D}
δD? 的像素的比例,
δ
D
\delta_{D}
δD? 可以取1.0、2.0
|