[人工智能] 【OpenCV】—图像金子塔与图片尺寸缩放

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【OpenCV】—图像金子塔与图片尺寸缩放 -> 正文阅读

[人工智能]【OpenCV】—图像金子塔与图片尺寸缩放

序言： 继续，继续，开干！！！
本节学习OpenCV中的函数pyrUp和pyrDown对图像进行向上和向下采样，以及了解专门用于缩放图像尺寸的resize函数的用法

文章目录

1、引言

如果想要将某种尺寸的图像转换为其他尺寸的图像：如放大或者缩小

resize函数，最直接
pyrUp()、pyrDown()函数。即图像金字塔相关的两个函数，对图像进行向上采样和向下采样的操作

2、关于图像金字塔

图像金字塔是图像中多尺寸表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构。

图像金字塔最初用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的，分辨率逐步降低且来源于同一张原始图的图像集合。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。

如下：层级越高，则图像越小，分辨率越低。

在这里插入图片描述

一般情况下有两种类型的图像金字塔常常出现在文献和以及实际运用中，它们分别是：

高斯金字塔(Gaussianpyramid)——用来向下采样，主要的图像金字塔
拉普拉斯金字塔(Laplacianpyramid)——用来从金字塔底层图像重建上层未采样图像，在数字图像处理中也即是预测残差，可以对图像进行最大程度的还原，配合高斯金字塔一起使用。

区别：高斯金字塔用来向下降采样图像，而拉普拉斯金字塔则用来从金字塔底层图像向上采样，重建一个图像。

内容：要从金字塔第i层生成第i+1层（第i+1层表示G i+1)，我们先要用高斯核对Gi进行卷积，然后删除除所有偶数行和偶数列，新得到图像面积会变为源图像的四分之一。按照上述过程对输入图像G0执行操作就可以参数整个金字塔。当图像向金字塔的上层移动的时，尺寸和分辨率会降低。从金字塔中上一级图像生成下一级图像的可以用PryDown，而通过PryUp将现有的图像在每个维度都放大两遍

总之：上述讲述的向下与向上采样，是针对图像的尺寸而言的（与金字塔的方向相反），向上就是图像的尺寸加倍，向下就是图像的尺寸减半。

（1）对图像向上采样——pyrUp函数：不是降采样逆操作。图像首先在每个维度上扩大为原来的两倍，新增的行（偶数行）以0填充。然后给指定的滤波器进行卷积（实际是一个在每个维度都扩大为原来两倍的过滤器）去估计“丢失”像素的近视值。
（2）对图像向下采样——pyrDown函数：是一个不会丢失信息的函数。为了恢复原来更高的分辨率图像，获得由降采样操作丢失的信息。

3、高斯金字塔

说明： 高斯金字塔是通过高斯平滑和亚采样获得一系列采样图像，也就是说第K层高斯金字塔通过平滑、亚采样就可以获得K+1层高斯图像。高斯金字塔包含了一系列低通滤波器，其截至频率从上一层到下一层以因子2逐渐增加，所以高斯金字塔可以跨越很大的频率范围。

补充：亚采样：就是下采样。对于序列来说，就是按固定间隔地抽取原序列，获得新序列。新序列是原序列的子序列。对于图像来说，也类似。比如256256的图像，进行一次间隔为2的下采样，就变成了128128的子图像，再来一次，就变成了64*64，依此类推。。说白了，采样也好，采样也好，都是只取原序列或者原图像的一部分数据，至于取的方法就很多了。。

在这里插入图片描述

3.1 对图像的向下采样（pyrDown()函数）

为获取层级为Gi+1的金字塔图像，采用如下方法：

（1）对图像Gi进行高斯内核卷积

（2）将所有偶数行和列去除

得到的图像即为Gi+1的图像，显而易见，结果图像只有原图的四分之一。通过对输入图像Gi（原始图像）不停迭代以上步骤就会得到整个金字塔。

void pyrDown(InputArray src,OutputArray dst,const Size &dstszie=Size(),int borderType=BORDER_DEFAULT);

第一个参数：输入图像，即源图像，填Mat类的对象即可
第二个参数：输出图像，和源图像有一样的尺寸和类型
第三个参数：输出图像的大小；有默认值Size()，即默认情况下，又Size Size((src.cols+1)/2，(src.rows+1)/2)来进行计算，且一直需要满足下列条件：

在这里插入图片描述

第四个参数：边界模式

#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
using namespace cv;
int main()
{
	//载入原始图
	Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
	Mat tmpImage, dstImage;//临时变量和目标图定义
	tmpImage = srcIamge;//将原始图赋给临时变量
	//显示原图像
	imshow("【原始图】", srcIamge);
	//进行向下采样操作
	pyrDown(tmpImage, dstImage, Size(tmpImage.cols / 2, tmpImage.rows / 2));
	//显示效果图
	imshow("【效果图】", dstImage);
	waitKey(0);
}

在这里插入图片描述

3.2 对图像的向上取样（pyrUp()函数）

说明：如果想放大图像，则需通过向上取样操作得到

（1）将图像在每个方向扩大为原来的两倍，新增的行和列以0填充

（2）使用先前同样的内核（乘以4）与放大后的图像卷积，获得“新增像素”的近视值

为得到图像即为放大后的图像，但与原来的图像相比会发觉比较模糊，因为在放缩的过程中已经丢失了一些信息。

void pyrUp(InputArray src,OutputArray dst,const Size &dstsize=Size(),int borderType=BORDER_DEFAULT);

第一个参数：输入图像，即源图像，填Mat类的对象即可
第二个参数：输出图像，和源图像有一样的尺寸和类型
第三个参数：输出图像的大小，有默认值Size()，即默认情况下，由Size（src.cols* 2，src.rows *2)来进行计算，且需要满足以下条件：

在这里插入图片描述

第四个参数：边界模式

示例：

#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
#include<iostream>
using namespace std;
using namespace cv;
int main()
{
	//载入原始图
	Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
	Mat tmpImage, dstImage,dstImage1;//临时变量和目标图定义
	tmpImage = srcIamge;//将原始图赋给临时变量
	//显示原图像
	imshow("【原始图】", srcIamge);
	//进行向下采样操作
	pyrUp(tmpImage, dstImage, Size(tmpImage.cols*2, tmpImage.rows*2));
	cout << tmpImage.cols << endl;
	//显示效果图
	imshow("【效果图】", dstImage);
	
	waitKey(0);
}

确实有点模糊：

在这里插入图片描述

4、拉普拉斯金字塔

拉普拉斯金字塔第i层的数学定义：

在这里插入图片描述

公式说明：Gi表示第 i 层的图像，而UP()操作是将源图像中位置为(x,y)的像素映射到目标图像的（2 *x+1,2 * y+1)位置，即在进行向上取样。符号x表示卷积，g 5x5为5x5的高斯内核。

原理：拉普拉斯金字塔是通过源图像减去缩小后再放大的图像的一系列图像构成的

5、尺寸调整：resize()函数

说明：此函数将源图像精确地转换为指定尺寸的目标图像。如果源图像中设置了ROI，那么resize()函数会对源图像的ROI区域进行调整图像尺寸的操作，来输出到目标图像中。

void resize(InputArray src,OutputArray dst,Size dsize,double fx=0,double fy=0,
int interpolation=INTER_LINEAR);

第一个参数：输入图像，即源图像，填Mat类的对象即可
第二个参数：输出图像，当其非零时，有着dsize的尺寸，或者由src.size()计算出来
第三个参数：输出图像的大小。如果它等于零，由下士计算：
$d s i z e = S i z e (r o u n d (f x ? s r c . c o l s), r o u n d (f y ? s r c . r o w s))$
其中，disize、fx、fy都不能为0
第四个参数：沿水平轴的缩放系数，有默认值0，且当其等于0时，由下式计算
$(d o u b l e) d s i z e . w i d t h / s r c . c o l s$
第五个参数：沿垂直轴的缩放系数，有默认值0，且当其等于0时，由下式计算
$(d o u b l e) d s i z e . h e i g h t / s r c . r o w s$
第六个参数：用于指定插值方式，默认值为INTER_LINEAR（线性插值）

可选的插值方式如下：

（1）INTER_NEAREST——最近邻插值

（2）INTER_LINEAR——线性插值（默认值）

（3）INTER_AREA——区域插值（利用像素区域关系的重采样插值）【缩小图像选择】

（4）INTER_CUBIC——三次样条插值（超过4x4像素邻域内的双三次插值）【放大图像】【效率慢】

（5）INTER_LANCZOS4—Lanczos插值（超过8x8像素邻域的Lanczos插值)【放大图像】【效率高】

示例程序：

#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
#include<iostream>
using namespace std;
using namespace cv;
int main()
{
	//载入原始图
	Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
	Mat tmpImage, dstImage,dstImage1;//临时变量和目标图定义
	tmpImage = srcIamge;//将原始图赋给临时变量
	//显示原图像
	imshow("【原始图】", srcIamge);
	//进行尺寸调整操作
	resize(tmpImage, dstImage, Size(tmpImage.cols / 2, tmpImage.rows / 2), 0, 0, 3);
	resize(tmpImage, dstImage1, Size(tmpImage.cols *2, tmpImage.rows * 2), 0, 0, 3);
	//显示效果图
	imshow("【效果图】之一", dstImage);
	imshow("【效果图】之二", dstImage1);
	
	waitKey(0);
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U4u6s5MS-1657605031142)(C:\Users\lenovo\AppData\Roaming\Typora\typora-user-images\image-20220712134208184.png)]$