Deep Stereo using Adaptive Thin Volume Representation with Uncertainty Awareness
一、Method
1.Overview
data:image/s3,"s3://crabby-images/b1ea3/b1ea347cd8fa06d3f006af94f1a9292a2edd8135" alt="在这里插入图片描述"
主要创新:提出了ATV结构,使用概率体计算一个深度假设的置信区间,其本质为一种深度假设方法。
注:stage1使用最大深度范围的等间距采样,之后的两个stage使用ATV,深度假设平面数依次为[64,32,8]。
2.Multi-scale feature extractor
data:image/s3,"s3://crabby-images/003eb/003ebbd7e18e4e5a56de949338535e8feb65b985" alt="在这里插入图片描述"
注:最大通道数只有32.
3.3D CNN
data:image/s3,"s3://crabby-images/b3360/b33608531f5ddc8ebc12f4119aa64ab6ab1f0c9f" alt="在这里插入图片描述"
注:3D CNN网络结构相同,但权重不共享。
4.Uncertainty estimation and ATV
1.利用分布的方差进行不确定性估计,计算k阶段像素x处概率分布的方差: data:image/s3,"s3://crabby-images/210ba/210ba0c9d56da01b50b381b9f21f3078b514ce61" alt="在这里插入图片描述" D为深度假设平面数,P为概率体,L为深度假设值。
2.置信区间: data:image/s3,"s3://crabby-images/26cf0/26cf0ca1c146774592798ce2868d033cab489f00" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/2f81c/2f81ccf8f41dec9e07a89b6d432c9194e91a45cc" alt="" λ是一个标量参数,用于确定置信区间的大小。
3.第k+1阶段的深度假设: ??给定深度假设平面数,在区间Ck(x)内等间距采样。
参考文献: [1] Cheng S, Xu Z, Zhu S, et al. Deep stereo using adaptive thin volume representation with uncertainty awareness[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 2524-2534.
|