Deep Stereo using Adaptive Thin Volume Representation with Uncertainty Awareness
一、Method
1.Overview
主要创新:提出了ATV结构,使用概率体计算一个深度假设的置信区间,其本质为一种深度假设方法。
注:stage1使用最大深度范围的等间距采样,之后的两个stage使用ATV,深度假设平面数依次为[64,32,8]。
2.Multi-scale feature extractor
注:最大通道数只有32.
3.3D CNN
注:3D CNN网络结构相同,但权重不共享。
4.Uncertainty estimation and ATV
1.利用分布的方差进行不确定性估计,计算k阶段像素x处概率分布的方差: D为深度假设平面数,P为概率体,L为深度假设值。
2.置信区间: λ是一个标量参数,用于确定置信区间的大小。
3.第k+1阶段的深度假设: ??给定深度假设平面数,在区间Ck(x)内等间距采样。
参考文献: [1] Cheng S, Xu Z, Zhu S, et al. Deep stereo using adaptive thin volume representation with uncertainty awareness[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 2524-2534.
|