| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文精读】Parallax-tolerant Image Stitching -> 正文阅读 |
|
[人工智能]【论文精读】Parallax-tolerant Image Stitching |
图像拼接系列相关论文精读
文章目录论文题目:允许视差的图像拼接 关键词:大视差,种子特征点,CPW,接缝 摘要视差处理是图像拼接领域一项有挑战性的任务。在输入图片的整个重叠区域不需要完美配准的情况下,本文提出了一个局部拼接方式来解决视差问题。在可以无缝融合的局部区域,只需用某一种方式配准。我们采用一种混合的配准模型,它结合单应性和内容保护扭曲,提供处理视差的灵活性,避免令人讨厌的局部扭曲失帧。我们提出一个高效的随机算法,它和内容保护扭曲结合,寻找单应矩阵,从而给予最优拼接。我们通过搜索一个似乎是真实的接缝并使用接缝成本作为衡量标准来预测一个单应矩阵使图片近乎真实拼接。这种接缝寻找方法仅通过考虑几何配准和图像内容粗略地以配准图片为标准衡量接缝是否接近真实。然后,使用最优单应矩阵预配准输入图片,进一步使用内容保护扭曲局部精细化配准。最后,使用标准接缝算法和多频融合算法将配准图结合在一起。我们的实验展示我们的方法可以高效拼接图片,解决大视差问题。 1.介绍图像拼接使一个很好的研究课题。它的第一步就是配准输入图像。早期的方法是在两张图片之间,用一个2D变换,典型的如单应矩阵,使用它来配准。由于单应矩阵不能解决视差,这些方法要求输入图片应该在相同的视点采集,或者场景基本在同一平面。否则,就找不到单应矩阵来配准图像,会导致伪影(artifacts,先这么翻译吧,就是效果不好的产物),如鬼影或者破坏了图片结构。虽然先进的图像混合技术,如接缝和融合,可以解决这些伪影,但它们不能解决未配准问题。 笔者注:所以本文方法又能解决大视差问题,又能解决拼接伪影,又能解决未配准问题。可能只是大视差条件下,效果才比较好? 最近的图像拼接方法使用空间变化扭曲算法配准图片。虽然空间变化扭曲比单应矩阵更好控制视差,但是它不能很好地解决大视差问题。图1展示一个有挑战性的例子,两张输入图片的视差很大。 本文中,我们突出一个容忍视差的图像拼接方法。我们的方法建立在“图像拼接不是必须完美的配准整个重叠区域”这种条件之上的。相反,我们只需要配准它们以这样的方式—— 我们提出一种高效随机搜索算法,首先粗略寻找局部配准的单应矩阵。在这里,我们通过从粗略配准图中寻找最优接缝,使用接缝成本来判定单应矩阵的得分,来预测单应矩阵对于局部拼接的好坏。我们使用图割算法寻找接缝,通过考虑几何配准和图像内容,仅从粗略配准图中评估近似真实的接缝。一旦我们找到最优单应矩阵,就使用它预拼接输入图片,然后使用内容保护扭曲优化配准。 本文主要的贡献时一个高效且鲁棒的拼接方法来处理大视差问题。我们的方法主要来自局部拼接,通过内容保护扭曲和接缝裁剪增强,探索图像内容和几何配准的关系,找到最优配准的局部区域。正如我们实验展示的,我们的方法可以拼接大视差的图像。 笔者注:用一个例子解释了两张图片的大视差,强调本方法不注重配准,而注重单应,改良了选择单应矩阵的方式,结合单应和内容保护扭曲。本节的内容与摘要差不多。 2.相关工作略。后面补上,主要看本文算法。 3.容忍视差的图像拼接我们的方法使用常用图像拼接流程。具体地,首先配准输入图像,然后使用接缝裁剪算法找到接缝去切割配准图像,最后应用多频段融合算法生成最终拼接图。我们的贡献时一个新颖的图像配准方法,它可以以一种最优的图像拼接方式配准图像。 我们观察到不需要在整个图像重叠区域完美配准图像。事实上,对于大视差图像,非常难完美配准。我们的目标是在一个局部区域配准图像,这个局部区域可以找到一个接缝去分割它们。我们应用随机算法搜索最佳拼接。具体,首先选择SIFT特征点,并匹配它们。然后随机算则一个种子特征点,并把它和它的相邻特征点看成一组,这是为了评估配准,因为我们的目标就是让局部区域有紧密的特征分布。我们评估这样配准的拼接质量。如果这样配准对拼接足够好,就停止;否则重复配准估计和质量估计。以下我们先讨论这个算法的关键部分,然后提出算法描述细节。 3.1 配准模型选择第一个问题就是选择什么配准模型。有两个主流选项:全局2D变化,如单应矩阵,和空间变化扭曲,如内容保护扭曲。大多数方式使用全局2D变换配准两张图。全局2D变换有一个显著的优势,它全局扭曲图像,避免令人不满的局部扭曲损失。例如,单应矩阵可以保护直线和相似变换进而保护目标形状不变。但是它们对于操作视差是刚性的。对于图像拼接,虽然我们讨论不需要整个重叠区域配准,但是也要尽可能更好更大的配准公共区域。然而,对于大视差的图像,2D变换,如单应矩阵,通常仅配准一个小的局部区域。相反,内容保护扭曲更灵活,更好配准,但通常会有局部损失。 3.2 配准质量评估一个简单的评估拼接质量的方式就是上面提到的混合配准,首先使用单应矩阵扭曲图片,并且应用内容保护扭曲。然后,我们可以比较扭曲图片,参照图用于测试这两张图配准的有多好。然而,这种方式不能可靠地预测是否能找到重叠区域内一个很好的接缝。而且,这种方式不会考虑拼接图内容的影响。对于拼接,当图像区域比如蓝天不需要完美配准时,主要的图像特征,例如边缘,应该很好地配准。最后,在随机算法中,无论什么时候我们评估拼接质量,这种方式很慢,因为它需要内容保护扭曲。 我们解决了上述问题。首先,我们评估拼接质量基于图像边缘而不是直接基于整个图像。然后,我们仅评估单应矩阵如何支撑拼接。这样简化是合理的,因为内容感知扭曲是非常有效的,如果仅小范围调整全局扭曲。但它也带来了一个挑战:我们方法中的单应矩阵的设计是松散的,不能精确配准两张图像。然后我们需要预测从粗略配准图中如何配准能达到无缝拼接。通过寻找粗略配准图中的近乎真实的接缝,使用接缝成本给配准打分,我们解决了这个挑战。 具体相关算法这里开始 我们首先对输入的图片下采样,为了提升速度和允许小的未配准。然后对输入图片使用Canny边缘检测算法,计算边缘映射。边缘映射对于允许小的未对准是低通滤波器。我们计算扭曲边缘映射和参照图的边缘映射直接的不同,获得这个不同映射
E
d
E_d
Ed?。 基于公式(1)中定义的边缘成本,接缝寻找问题作为一个图割问题解决。一旦我们获得接缝,我们使用接缝的成本给配准质量打分。 3.2.1 单应放映虽然一些单应矩阵可以完成无缝拼接,但有时也有很严重的图像扭曲,并导致视觉效果不好。我们发现这一的单应矩阵,并且在评估它们的配准质量之前就丢弃它们。我们衡量透视扭曲,通过对图片
I
I
I应用单应矩阵
H
H
H,计算
H
H
H是怎样偏离最佳适配相似变换的。
C
i
C_i
Ci?是输入图像
I
I
I的四个角点之一,
C
i
 ̄
\overline{C_i}
Ci??是
H
H
H变换的对应点。我们用下面公式找到最佳适配相似变换
H
s
^
\hat{H_s}
Hs?^?: 3.3 配准算法总结我们现在描述随机算法去评估拼接较好的配准。
3.3.1 内容保护扭曲CPW各种各样的内容保护扭曲方法应用广泛,例如视频防抖和图像与视频重标定。虽然内容保护扭曲不能总是单独用于配准图像的整个重叠区域,它却很适合小的局部调整。因此,我们使用它去进一步配准从最优单应矩阵到参照图的预扭曲结果,正如图2(b)和(c)展示的那样。 局部配准
I
,
I
 ̄
I,\overline I
I,I的特征点在参照图中应该可以匹配它们的对应位置,以至于它们可以很好的配准。虽然特征点
P
j
P_j
Pj?通常上不是和任意一个网格顶点一致,但我们可以找到包含它的网格。然后表示
P
 ̄
j
\overline P_j
Pj?为
I
 ̄
\overline I
I中
P
j
P_j
Pj?的对应点,用一个四个网格顶点的与对应点的线性组合。线性组合系数用逆双线性差值计算。这些系数用于结合输出图像
I
^
\hat I
I^的顶点,从而计算
P
^
j
\hat P_j
P^j?。我们可以定义配准能量: 全局配准上述的配准仅限制在有被选择的特征点的重叠区域内扭曲。对于其他的区域,内容保护扭曲通常会使它们变形。当预扭曲结果
I
 ̄
\overline I
I已经提供一个好的近似值时,我们的方法会尽可能地促使无特征点的区域去接近预扭曲的结果。因此,定义下面的全局配准: V i ^ , V i  ̄ \hat{V_i},\overline{V_i} Vi?^?,Vi??分别是内容保护扭曲和预扭曲结果中的对应顶点 。 τ i \tau_i τi?是一个二值。如果 V i V_i Vi?没有相邻特征点,就把它置为1;否则置为0。这样使用它提供了局部配准灵活性。 平滑扭曲过程中进一步最小化局部损失,我们让预扭曲结果中的网格做一个相似变换。我们使用论文【11】中的二次能量编码相似变换限制。具体地,考虑三角形
△
V
 ̄
1
V
 ̄
2
V
 ̄
3
\triangle\overline V_1\overline V_2\overline V_3
△V1?V2?V3?。顶点
V
 ̄
1
\overline V_1
V1?可以通过其他两个顶点表示: (笔者注:看到这发现是 As-Rigid-As-Possible Shape Manipulation这篇文章里的知识,正好复习一下。) 最优结合上面的三个能量得到下面的求下面最小能量问题。 4.实验我们用了一系列大视差图片做实验。也和一些主流的方法做了比较,包括PS,自动拼接,APAP,SEAM.对于APAP,我们使用作者源码.虽然代码仅配准图像,我们添加了与我们相同的相同的接缝剪裁和多频段融合算法.本文仅展示一些有代表性的拼接结果,部分裁剪不正.请在项目网站上参考更多的结果,没有裁剪过的,更中性的结果.
4.1 讨论我们的方法只需要部分配准,适配松散的单应矩阵,正如3.2中描述的那样.因此,我们的方法有时使用更严格的全局变换,和从单应矩阵中移除透视损失相比.图5(a)展示了我们的方法对于有着显著透视损失的初始配准拼接结果.一旦我们用相似变换代替单应矩阵对于初始配准,拼接结果就会有更少的损失,正如图5(b)中展示的. 我们的方法不仅在大视差图片上效果好,也在APAP中提供的数据集上效果很好.于此同时,我们找到了一些失败的例子展示在项目网站上.一个就是输入图片有大视差和充满了显著结构.对于拼接,图像必须能配准,以至于至少存在一个局部公共区域,这个区域能找到最佳拼接缝.在大视差的图片中,通常不再是一个能配准的局部区域.我么的方法探索了不显著的区域不需要被很好的配准,并把这考虑到搜索最好局部配准.但如果图片有大视差并充满了显著性结构,我么的方法有时不能起作用因为没有不显著的区域存在. 关键步骤:最优局部单应矩阵评估和CPW 5.结论本文提出了一个允许视差的图像拼接方法.我们发现,有显著时差的图片不能在整个重叠区域很好的配准,比如没有伪影.并且这些图片实际上不需要在整个拼接区域完美配准.然后我们提出了一个局部优化拼接的方式.设计了一个高效算法评估什么样的结果是无缝的配准结果.我们的实验在这个具有挑战性的拼接任务上展示了我们算法的高效. 总结
附录参考文献中的论文[10]是纹理映射,[11]是3.3.1中提到的CPW,就是下面这篇文章,感兴趣的同学可有看一下Content-preserving warps for 3D video stabilization 实验中提到的算法: 本文项目相关链接,具体的例子都可以在其中找到: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 21:17:31- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |