| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文精读】Parallax-Tolerant Image Stitching Based on Robust Elastic Warping -> 正文阅读 |
|
[人工智能]【论文精读】Parallax-Tolerant Image Stitching Based on Robust Elastic Warping |
图像拼接系列相关论文精读
文章目录论文题目:基于非常灵活扭曲的大视差图像拼接算法 # 摘要 图像拼接旨在生成高质量低运算成本的全景图。本文,我们提出一个基于鲁棒性灵活扭曲的解决大视差问题的图像拼接算法,它在完成精确配准的同时也有很高的效率。给定一组图片间的匹配点,用一个分析的扭曲函数消除视差错误。然后,输入图像被扭曲,根据计算图像的网格形变。无缝的全景图通过直接重投影扭曲图片生成。作为该方法的重要部分,特征细化的贝叶斯模型用于提出错误的局部匹配。和现有的方法相比,这使得配准更具鲁棒性。而且,我们的扭曲可以和其他不同的变换类型高度共存。它和全局相似变换结合,这种灵活的策零作为一个例子提供。文本提出的方法的表现使用几个有挑战性的例子展现。 关键词:图像拼接,图像配准,零或扭曲,特征优化,计算效率,计算机视觉。 1.介绍在计算机视觉领域,有视差的图像拼接依然是个有挑战性的工作。生成高分辨率的全景图和视频是至关重要的,它在现在的多媒体技术的应用中扮演重要角色,例如监视,沉浸式交流,虚拟现实。传统的拼接方式通常在每张图片上计算一个最优全局变换。一个有代表性的例子就是自动拼接。全局方法在理想情况下效果很好,理想情况指的是相机移动可以忽略或者场景近乎在同一个平面。然而,对于有视差的情况,例如图1中的输入图片,伪影会出现在结果全景图中。 和基于网格的模型不同,我们已经研究了非刚性网格变换方法,在整个图像平面直接计算损失函数,例如光流,结构化变形,薄板样条差值(TPS)。给定计算出的全局变换,这些方法把局部配准看作一个常规的带有平滑限制的匹配问题。光流场的计算包括图像内容的稠密匹配,这是一个旷日持久的工作。而且,在不对等条件变得更大时,光流变得更不可靠。因此,它很少直接用于图像拼接中处理视差。对于结果变形和TPS,配准是基于几个锚点的。因此,扭曲非常容易产生匹配错误。换句话说,匹配数据中已存在的内点会导致严重的扭曲失真。然而,正如我们知道的,在图像弹性配准方面,罕有研究关注内点删除。由于这些缺点对于图像自然拼接来说,变形函数的应用有很大的限制。 本文中,我们既关注图像配准的准确度也关注效率。基于鲁棒弹性扭曲的视差容忍图像拼接算法由此提出。我们方法的基本数学框架是建立在TPS模型之上的。我们首先介绍TPS的基本理论和给出一组匹配点的弹性扭曲模型。其次,通过分析扭曲参数的统计规律,我们提出一个特征优化的贝叶斯模型,它用来适当剔除匹配数据中的局部内点。在重叠区域配准完成后,通过在非重叠区域使用线性降低变形函数,我们逐渐改变局部扭曲直到全局变换。这样,全局投影就被保护了。得益于我们扭曲的高兼容性,我们也提出一个灵活且高效的策略,将其和全局相似变换结合。该方法可以扩展到多图拼接,而且我们也提出整个扩展的工作流程和一些重要的准则。 该扭曲方式可以看作基于网格的模型和直接变形策略的结合。正如图2(a)中展示的,特征点的投影偏差首先使用全局相似变换计算。然后整个图片的偏差使用变形函数插值运算。为了加速运算,我们在整个图像构建网格,但仅在网格点计算函数值,正如图2(b)中展示的那样。 2.相关工作写的挺好值得学习,还有其他方法的总结。此处先略。 3.强弹性局部配准A.弹性局部配准给定两个有重叠区域的图片
I
p
,
I
q
I_p,I_q
Ip?,Iq?,它们的匹配点为
p
i
=
(
x
i
,
y
i
)
T
,
q
i
=
(
u
i
,
v
i
)
T
,
i
=
1
,
.
.
.
,
n
\mathbf p_i = (x_i,y_i)^T,\mathbf q_i = (u_i,v_i)^T,i=1,...,n
pi?=(xi?,yi?)T,qi?=(ui?,vi?)T,i=1,...,n,两张图片的全局变换使用DLT或者其他代表性的方法计算如自动拼接: 起初,弹性扭曲用于解决匹配医学图像,不同参数的扭曲方法变体用来适配具体的应用需求。径向基函数(RBFs)在给定锚点的图像扭曲中已经是很有用的工具。我们选择带有一个简单RBF类型的TPS去规划图形变形,因为它在配准质量和效率上都有很好的表现。 具体地,整张图片
I
q
I_q
Iq?的变形可以用
g
(
x
,
y
)
=
(
g
(
x
,
y
)
,
h
(
x
,
y
)
)
T
\mathbf {g}(x,y) = (g(x,y),h(x,y))^T
g(x,y)=(g(x,y),h(x,y))T表示,
g
(
x
,
y
)
,
h
(
x
,
y
)
g(x,y),h(x,y)
g(x,y),h(x,y)是x,y方向上的变形。下面简单分析,我们使用
g
(
x
,
y
)
g(x,y)
g(x,y)代替
g
(
x
,
y
)
\mathbf {g}(x,y)
g(x,y),因为
g
(
x
,
y
)
,
h
(
x
,
y
)
g(x,y),h(x,y)
g(x,y),h(x,y)是总体同一且相互独立的。最有扭曲能量函数包含以下两项:配准项
J
D
J_D
JD?和平滑项
J
S
J_S
JS? 为了加速运算,
C
x
×
C
y
C_x × C_y
Cx?×Cy?大小的网格构建在图像平面上。扭曲首先计算网格点,然后线性插值到所有其他像素。对于图1中展示的输入图片,计算扭曲函数展示在图3。 B.特征匹配贝叶斯特征细化模型在特征选择和特征匹配时,对于自然图片来说,位置错误和误匹配问题几乎是不可避免的。为了正确配准,有必要剔除错误匹配。大多数的主流方法用RANSAC去除匹配数据中的异常值。从计算效率考虑,在计算局部扭曲之前,全局变换通常作为提供RANSAC的最小值。然后,全局RANSAC和局部适应模型的矛盾出现了。这会导致两个不好的结果: 正如我们所知的,很少有研究关注图像配准的局部异常点剔除上。局部DLT方法移除异常值在他们很广泛的基准图像拼接方法之上的。单应矩阵用每个特征点计算,通过在整个R像素的邻居上应用DLT。如果差值误差少于阈值 γ \gamma γ,就认为是正确匹配。局部DLT方式对于纹理区域是有效的,但对于没有足够特征的区域是失败的。具体地,如果匹配点在与它相邻的特征数量少于4,不能计算机该位置的一个可靠单应矩阵。图4?展示了局部DLT的异常值剔除结果,通过作者原文将参数设置为 R = 50 , γ = 5 R=50,\gamma = 5 R=50,γ=5。一些正常值被错误地剔除了,因为他们周围没有足够的特征点去支撑判断它们到底是正常值还是异常值。APAP结合局部DLT的结果展示在图4(b)中。 通过分析x方向上的权重 w i w_i wi?的分布和y方向上的权重 v i v_i vi?的分布,两个权重附带在RBF ? i ( x ) \phi_i(\mathbf x) ?i?(x),我们提出一个鲁棒性特征细化模型。作为松散全局RANSAC后的一步,它可以适当移除局部异常值。尽管 w i w_i wi?, v i v_i vi?是全局计算的,我们的模型不会有不满足足够匹配的情况。模型的特征细化结果见图4(e),比a和c更好。值得注意的是,特征细化模型上面A中提到的权重计算操作。因此,它是一个很好的弹性局部配准模型。 为了便于定量分析,关于匹配数据的两个理想化假设首先提出。 假设1:两个相邻像素间的投影偏移变换是独立同分布的。 上面假设中的像素不是真实的图像像素,而是一个抽象概念,它代表图像平面中场景点的投影。因此,一个理想的图像应该是包含无限多的这样的像素。在假设1和2的条件下,一个有趣的推论可以通过中心极限定理得到: 给定一对匹配点
{
p
i
,
q
i
}
\{\mathbf p_i,\mathbf q_i\}
{pi?,qi?},匹配点是否正确用一个二值
τ
i
∈
{
0
,
1
}
\tau_i \in \{0,1\}
τi?∈{0,1}表示。用
p
1
p_1
p1?表示所有匹配点中正确匹配点的概率,则
p
(
τ
i
=
1
)
=
p
1
,
p
(
τ
i
=
0
)
=
1
?
p
1
p(\tau_i=1)=p_1,p(\tau_i=0)=1-p_1
p(τi?=1)=p1?,p(τi?=0)=1?p1?。考虑事件
A
i
=
{
∣
w
i
∣
>
t
σ
ω
}
A_i = \{|w_i|>t\sigma_{\omega}\}
Ai?={∣wi?∣>tσω?},我们有
p
(
A
i
∣
τ
i
=
1
)
=
2
(
1
?
Φ
(
t
)
)
p(A_i |\tau_i=1)=2(1-\Phi(t))
p(Ai?∣τi?=1)=2(1?Φ(t)),其中
Φ
(
?
)
\Phi(\cdot)
Φ(?)表示标准正态分布。
A
i
A_i
Ai?的概率为: 我们和三simga原则一致将t置为3,以至于 Φ ( t ) = 0.9987 \Phi(t)=0.9987 Φ(t)=0.9987。如果 p 1 ∈ [ 0 , 0.9973 ] , 则 p ( τ i = 0 ∣ A i ) ≥ 0.5 p_1 \in [0,0.9973],则p(\tau_i=0|A_i)\geq0.5 p1?∈[0,0.9973],则p(τi?=0∣Ai?)≥0.5。这意味着匹配点 { p i , q i } \{\mathbf p_i,\mathbf q_i\} {pi?,qi?}更可能是不正确的匹配,如果事件 A i = { ∣ w i ∣ > 3 σ w } A_i = \{|w_i|>3 \sigma_w \} Ai?={∣wi?∣>3σw?}发生。 根据以上分析,权重w和v的分布服从于剔除异常点的标准。在 p 1 ∈ [ 0 , 0.9973 ] , i f ∣ w i ∣ > 3 σ w ? o r ? ∣ v i ∣ > 3 σ v p_1 \in [0,0.9973],if |w_i|> 3 \sigma_w \ or \ |v_i|> 3\sigma_v p1?∈[0,0.9973],if∣wi?∣>3σw??or?∣vi?∣>3σv?,我们将 { p i , q i } \{\mathbf p_i,\mathbf q_i\} {pi?,qi?}看作异常点,并从匹配数据中去除。几何学上可以这样解释:如果它的投影偏移和其他相邻匹配有显著不同,那么这个匹配很可能是错误的。尽管有一些正确匹配点可能会因为概率模型本身被误去除,配准质量不会受到影响。图4(f)展示了细化匹配点之后的拼接结果。 实际上,参数
σ
w
\sigma_w
σw?和
σ
v
\sigma_v
σv?是未知的。我们使用所有正确匹配的标准差
σ
~
w
\tilde \sigma_w
σ~w?和
σ
~
v
\tilde \sigma_v
σ~v?来近似计算它们。通过迭代算法1将误配准点去除。特征细化之后,图4(e)中的权重分布w和v对应图5. C.全局变换平滑过渡前面部分介绍了鲁棒弹性扭曲模型配准重叠区域。然而,直接外推扭曲到非重叠区域会有过拟合问题。这种不好的情况可以在图3中见到。我们想通过平滑地把局部扭曲改变为计算全局变换,尤其是全局单应矩阵H,以此减少这种情况。在非重叠区域逐渐将变形函数
g
(
x
,
y
)
\mathbf g(x,y)
g(x,y)减少到0就可以简单地做到这一点。限制形变函数: D.和全局相似变换结合提到的扭曲仅涵盖图像内容操作,和变换类型无关。我们使用全局单应矩阵,因为它在重叠区域是局部投影的近似。然而,当拼接广视野的图片时,全局单应矩阵在非重叠区域可能导致投影损失。正如图6(a)中寺庙数据集中展示的那样。 细化来自3-B章节中的方法被认为是标准的配准点
{
p
i
,
q
i
}
,
i
=
1
,
.
.
.
,
n
r
\{\mathbf p_i,\mathbf q_i\},i=1,...,n_r
{pi?,qi?},i=1,...,nr?之后,我们计算全局相似变换
S
S
S通过最小化
J
A
=
∑
i
=
1
n
r
∣
∣
S
p
^
i
?
q
i
∣
∣
2
(13)
J_A = \sum_{i=1}^{n_r}||\mathbf{S\hat{p}}_i-\mathbf{q}{_i}||^2\tag{13}
JA?=i=1∑nr??∣∣Sp^?i??qi?∣∣2(13) 整个流程图7展示。 不同于ANAP和其他方式如SPHP应用局部单应矩阵,我们的方法仅依靠全局单应矩阵H和全局相似矩阵S。当结合它们时,这种特点展示出相对更高效的性能。 笔者注:这里说的相对弱一些。。。其实但从肉眼的视觉效果上来看跟AANAP差不多。好在本文实验充足,从下面的SSIM指标中可以一览究竟。 E.复杂性与效率分析笔者注:第一次看见有分析图像拼接算法复杂性的,好评! 4.多图拼接本文提出的扭曲方法很容易延伸到多图拼接。通过直接同时移动每对偏移特征点产生弹性形变,它与投影模型是无关的。在这种方法下,全局优化技术簇调整不适合这种情况。实际上,在3-C中提出的全局投影保护方法的帮助下,这种附加的拼接方案足可以提供满意的结果。具体地,输入图片增加了配准和在全局图平面混合。在配准时,两个额外的问题应该考虑: (ii) 更新特征定位。配准图扭曲会导致匹配点有轻微的变化。在进一步处理与当前配准图有重叠部分的其他图片序列之前,特征位置必须更新。不像3-A中用到的逆映射那样,特征位置更新应该是一个正映射,因此新的位置不能直接从LUT中读取。在这种情况下, q = ( x , y ) T \mathbf q = (x,y)^T q=(x,y)T变成了未知,与公式(7)中的初始位置 q 0 = ( x 0 , y 0 ) T \mathbf q_0 = (x_0,y_0)^T q0?=(x0?,y0?)T不同,非线性的。然而,注意形变函数 g ( x , y ) = ( g ( x , y ) , h ( x , y ) ) T \mathbf{g}(x,y) = (g(x,y),h(x,y))^T g(x,y)=(g(x,y),h(x,y))T是利普希兹连续的,对于有限制大小的图片(这种观点的证明超过了本文的研究范围,就是证明不重要,略),并且在大多数情况下,利普希兹连续远小于1, p = ( x , y ) T \mathbf p = (x,y)^T p=(x,y)T依然可以通过应用公式(7)中的混合点迭代来计算。 给定N,输入图片为I1~IN,图像 { p i , j , k , q i , j , k } , i = 1 , . . . , N ? 1 , j = i + 1 , . . . , N , k = 1 , . . . , n i , j \{\mathbf p_{i,j,k},\mathbf q_{i,j,k}\},i=1,...,N-1,j=i+1,...,N,k=1,...,n_{i,j} {pi,j,k?,qi,j,k?},i=1,...,N?1,j=i+1,...,N,k=1,...,ni,j?匹配点,多图拼接的工作流见算法2。没有特殊说明的情况下,第一张图作为参照图。 5.实验我们完成了我们的算法并用一组实验评估它的性能。(源码见本文开头)包括:1)和现存方法比较拼接质量;2)测试和不同类型全局变换结合时的灵活性;3)和主流方式比较计算效率;4)多图拼接结果。待比较的方法有全局单应,自动拼接,APAP,SPHP,SPHP+APAP,ANAP,前两种时全局变换模型,其他的是局部适配拼接场。在我们的实验中,使用SIFT检测和匹配点。所有测试方法都用相同的匹配数据。 参数设置。比较方法的参数设置遵循其文章中的需求和最好结果的参数,如果提供了值得范围。对于我们的方法,权重参数 λ \lambda λ设置为图像大小X×Y的0.1%,缩放参数K设置为5乘最大偏移。在公平性能评估的前提下,所有的全景图拼接结果通过不同方式生成,它使用一个连续的10×10像素单元构建,并且重叠区域简单设置为重投影的图像平均。 A.比较拼接质量前面的章节中,我们已经展示了轨道、十字路口、和寺庙数据集的拼接结果。我们的方法可以精确配准所有的数据集。图8展示了一个有挑战性的例子,其中包含了一些不好的区域和重复纹理(马赛克确实是个体现重复纹理的好例子)。 第6行到第8行展示了使用局部错误点移除技术的结果。第6行展示APAP+local DLT的结果,比使用全局RANSAC误配准更好的消除了。第7行展示了我们的ELA模型和局部DLT结合起来的结果,仅有一点轻微的伪影。正如在3-B中分析的那样,贝叶斯特征细化比局部DLT更有鲁棒性。用贝叶斯特征细化的整体鲁棒ELA展示在第8行。三个放大区域匹配很准,不存在视觉伪影。 我们使用SSIM(结构化相似性)指标去定量评估不同方法的配准质量。测试图片可以从公共数据集中收集或我们自己采集。每对输入图片的重叠区域通过配准后计算对应SSIM获取。表1展示了8个测试方法的计算分数,其中5个用的全局错误点提出和3个局部错误点剔除。对于上面的11个有小视差或大视差的例子,所有的7个局部适配方法完成了可满足的拼接结果,因此分数非常接近。 B.灵活性评估正如我们在3-D中分析的,我们的扭曲模型比其他整体变换类型更灵活。更广泛的评估展示在图9. C.计算效率比较扭曲是直接来自于匹配点,可以有效计算的是网格化的拼接场。计算复杂性细节分析在3-E。这里,我们进一步评估在不同数据集上的计算效率,并和其他主流局部适配拼接方法比较,如APAP,SPHP+APAP,ANAP。所有的方法在相同的环境下进行,2G-HZ cpu,16GB RAM。为了更广泛的比较,我们使用两个不同的网格分辨率评估: D.多图拼接为了展示我们方法多图拼接的性能,图11展示了四个输入图片的数据,11(a)(b)分别是使用全局匹配和我们的方式配准的结果。 E.局限和失败案例弹性扭曲将场景看作一个连续表面。因此,我们的方式不能配准严格封闭的配准图。图13展示了两个失败案例,有重影出现在前景目标上。 6.总结一个有效且高效的基于鲁棒弹性扭曲的图像拼接方法在本文提出。首先,弹性扭曲模型是为了消除视差而建。没有牺牲配准的准确度,统一的网格单应设置在图像平面上,以此提高变形函数的计算效率。扭曲模型直接源于匹配点,然后应用于初始输入图像。因此,它整体可以看作一个全局模型。通过直接重投影扭曲图像获得全景图。其次,特征细化的贝叶斯模型用于适当去除匹配点集中的部分错误匹配点。这是扭曲模型中重要的一环,它可以使该方法比其他的方法更具鲁棒性配准。然后,我们提出了与全局相似变换结合的策略,提高了灵活性。最后,我们提出多图拼接的一整套工作流,还有一些重要的准则。拼接质量,灵活性和计算效率通过一系列严谨的对比实验得到验证。我们未来的工作将关注于更具鲁棒性的闭塞图片处理和视频拼接。 全文翻译结束 个人总结
附一些想法
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 21:08:03- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |