IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 计算机视觉-实验三(图像映射与全景拼接) -> 正文阅读

[人工智能]计算机视觉-实验三(图像映射与全景拼接)

一、全景拼接基本流程

  1. 针对某个场景拍摄多张/序列图像
  2. 计算第二张图像与第一张图像之间的变换关系
  3. 将第二张图像叠加到第一张图像的坐标系中
  4. 变换后的融合/合成
  5. 在多图场景中,重复上述过程

在上述流程当中,我们可以发现图像之间的变换关系是一个关键部分。

二、图像映射

1.流程

  1. 针对两张/多张图像提取特征
  2. 特征匹配
  3. 根据图像变换特点,选取合适的变换结构
  4. 根据DLT等方法计算变换结构
  5. 采用正向/逆向映射,利用插值方式实现图像映射变换

2.类型

图像映射类型有平移、旋转、尺度变换、仿射、透视映射、桶装映射等,不同的类型所对应的自由度也不同,如下图所示:
在这里插入图片描述
单应性变换即一个平面到另一个平面的映射关系。公式如下所示:
在这里插入图片描述

3.参数求解

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
得到最小二乘解,在平移问题中最小二乘解和平均残差得到的结果等价

4.仿射变换

残差:
在这里插入图片描述

平方和代价函数:
在这里插入图片描述

矩阵表达式:
在这里插入图片描述
在这里插入图片描述

5.单应性变化

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.前向映射

对于 f ( x ) f(x) f(x)中每个像素x,根据变换模型计算相应的映射坐标 x ’ = h ( x ) x’=h(x) x=h(x),并将x像素值赋给 g ( x ’ ) g(x’) g(x)
在这里插入图片描述

7.逆向映射

对于 g ( x ′ ) g(x^{'}) g(x)中的每个像素 x ′ x^{'} x,根据变换模型计算相应的映射坐标 x = h ? 1 ( x ′ ) x=h^{-1}(x') x=h?1(x)
在这里插入图片描述

8.像素插值

主要插值方法:

  • 最近邻插值
  • 线性插值
  • 双线性插值
  • 三线性插值

三、RANSAC求解单应矩阵

在直线拟合时,我们需要根据给定的若干二维空间中的点,求出直线 y = a x + b y=ax+b y=ax+b,并使得该直线对空间点的拟合误差最小,但可能存在噪声点对结果造成很大影响,如图所示:
在这里插入图片描述
此时我们可以随机选取两个点,并根据选择点构造直线,再给定阈值计算出inliers的数量
在这里插入图片描述

RANSAC loop

在这里插入图片描述

四、APAP算法

APAP算法流程:

  1. 通过SIFT得到两幅图像的匹配点对
  2. 通过RANSAC剔除外点,得到N对内点
  3. 利用DLT和SVD计算全局单应性
  4. 将原图划分网格,取网格中心点,计算每个中心点和原图上内点之间的欧氏距离和权重
  5. 将权重放到DLT算法的A矩阵中,构建新的W*A矩阵,重新SVD分解,得到当前网格的局部单应性矩阵
  6. 遍历每个网格,利用局部单应性矩阵映射到全景画布上,得到APAP变换后的原图
  7. 最后进行拼接线的加权融合
    在这里插入图片描述

五、图割方法

在寻找拼接缝时,我们希望找到一条不明显的拼接缝,而这就需要通过最大流最小割图割方法进行操作。
最大流:
给定指定有向图,其中有两个特殊的点源S(Sources)和汇T(Sinks),每条边有指定的容量(Capacity),求满足条件的从S到T的最大流(MaxFlow)。
最小割:
割是网络中定点的一个划分,它把网络中的所有顶点划分成两个顶点集合S和T,其中源点s∈S,汇点t∈T。记为CUT(S,T),满足条件的从S到T的最小割(Min cut)。
在这里插入图片描述

六、图像融合

在进行图像融合时我们通常采用multi-band blending策略进行融合
基本原理:
1.建立两幅图像的拉普拉斯金字塔
2.求高斯金字塔(掩模金字塔-为了拼接左右两幅图像)因为其具有尺度不变性
3.进行拼接blendLapPyrs() ; 在每一层上将左右laplacian图像直接拼起来得结果金字塔resultLapPyr
4.重建图像: 从最高层结果图
将左右laplacian图像拼成的resultLapPyr金字塔中每一层,从上到下插值放大并和下一层相加,即得blend图像结果
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

七、图像拼接

流程:

  1. 根据给定图像/集,实现特征匹配
  2. 通过匹配特征计算图像之间的变换结构
  3. 利用图像变换结构,实现图像映射
  4. 针对叠加后的图像,采用APAP之类的算法,对齐特征点
  5. 通过图割方法,自动选取拼接缝 根据multi-band blending策略实现融合

八、实验过程

from pylab import *
from numpy import *
from PIL import Image

# If you have PCV installed, these imports should work
from PCV.geometry import homography, warp
from PCV.localdescriptors import sift

"""
This is the panorama example from section 3.3.
"""

# set paths to data folder
featname = ['./panoramicpic3/' + str(i + 1) + '.sift' for i in range(5)]
imname = ['./panoramicpic3/' + str(i + 1) + '.jpg' for i in range(5)]

# extract features and match
l = {}
d = {}
for i in range(5):
    sift.process_image(imname[i], featname[i])
    l[i], d[i] = sift.read_features_from_file(featname[i])

matches = {}
for i in range(4):
    matches[i] = sift.match(d[i + 1], d[i])

# visualize the matches (Figure 3-11 in the book)
for i in range(4):
    im1 = array(Image.open(imname[i]))
    im2 = array(Image.open(imname[i + 1]))
    figure()
    sift.plot_matches(im2, im1, l[i + 1], l[i], matches[i], show_below=True)


# function to convert the matches to hom. points
def convert_points(j):
    ndx = matches[j].nonzero()[0]
    fp = homography.make_homog(l[j + 1][ndx, :2].T)
    ndx2 = [int(matches[j][i]) for i in ndx]
    tp = homography.make_homog(l[j][ndx2, :2].T)

    # switch x and y - TODO this should move elsewhere
    fp = vstack([fp[1], fp[0], fp[2]])
    tp = vstack([tp[1], tp[0], tp[2]])
    return fp, tp


# estimate the homographies
model = homography.RansacModel()

fp, tp = convert_points(1)
H_12 = homography.H_from_ransac(fp, tp, model)[0]  # im 1 to 2

fp, tp = convert_points(0)
H_01 = homography.H_from_ransac(fp, tp, model)[0]  # im 0 to 1

tp, fp = convert_points(2)  # NB: reverse order
H_32 = homography.H_from_ransac(fp, tp, model)[0]  # im 3 to 2

tp, fp = convert_points(3)  # NB: reverse order
H_43 = homography.H_from_ransac(fp, tp, model)[0]  # im 4 to 3

# warp the images
delta = 2000  # for padding and translation

im1 = array(Image.open(imname[1]), "uint8")
im2 = array(Image.open(imname[2]), "uint8")
im_12 = warp.panorama(H_12, im1, im2, delta, delta)

im1 = array(Image.open(imname[0]), "f")
im_02 = warp.panorama(dot(H_12, H_01), im1, im_12, delta, delta)

im1 = array(Image.open(imname[3]), "f")
im_32 = warp.panorama(H_32, im1, im_02, delta, delta)

im1 = array(Image.open(imname[4]), "f")
im_42 = warp.panorama(dot(H_32, H_43), im1, im_32, delta, 2 * delta)

figure()
imshow(array(im_42, "uint8"))
axis('off')
show()

实验结果:

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-25 18:06:59  更:2022-06-25 18:10:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 2:49:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码