最近本人在学习OpenCV,简要地记一下笔记,课后温习的同时便于日后查阅。
所用教程是唐宇迪老师的OpenCV教程,个人觉得讲解清晰易懂,附上链接:https://www.bilibili.com/video/BV1tb4y1C7j7?p=5
一、截取图像
当我们使用imread读取一张图片后,返回值是一个多维数组。
如果采用的是3通道BGR读取,那么这个数组会是一个三维的,第一个维度表示纵向的像素点,第二个维度表示横向的像素点,第三个维度表示BGR中的通道。
所以截取的时候直接使用数组切片即可。
1.所需模块与自定义函数
import cv2
import numpy as np
import matplotlib.pyplot as plt
def cv_show(name, mat):
cv2.imshow(name, mat)
cv2.waitKey(0)
cv2.destroyAllWindows()
2.截取
miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
#截取图片的一部分
cv_show('miku', miku[0:200, 0:200])
#截取图片的某个通道
cv_show('miku', miku[:,:,2])
?原图与处理得到的图片如下:
???????????
?3.直接切分通道——split
b, g, r = cv2.split(miku)
cv_show('b', b)
cv_show('g', g)
cv_show('r', r)
?处理得到的图片如下:
?
4.合并通道——merge
注意:merge传入的参数是一个元组!
m = cv2.merge((b, g, r))
cv_show('miku', m)
?运行即可再次得到原图
?二、简单处理图像
1.边界填充——copyMakeBoarder
### 函数原型
void copyMakeBorder( const Mat& src, Mat& dst,
int top, int bottom, int left, int right,
int borderType, const Scalar& value=Scalar() );
### 在python中使用
cv2.copyMakeBorder(src, top, bottom, left, right, borderType, value)
- src,dst:原图与目标图像
- top,bottom,left,right:分别表示在原图四周扩充边缘的大小
- borderType:扩充边缘的类型,OpenCV中给出以下几种方式
- value:若指定为常量填充,则需要设置常量填充的值
cv2.BORDER_REPLICATE | aaaaaa|abcdefgh|hhhhhhh | 复制粘贴边缘像素 | cv2.BORDER_REFLECT | fedcba|abcdefgh|hgfedcb | 镜像复制【包括边缘点】 | cv2.BORDER_REFLECT_101 | gfedcb|abcdefgh|gfedcba | 镜像复制【不包括边缘点】 | cv2.BORDER_WRAP | cdefgh|abcdefgh|abcdefg | 外包装法 | cv2.BORDER_CONSTANT | iiiiii|abcdefgh|iiiiiii | 常量复制 |
?2.数值相加
### 数组的值直接相加
mikuu = miku + 10
mikuuu1 = miku + mikuu
cv_show('mikuu', mikuu)
cv_show('mikuuu1', mikuuu1)
?
mikuuu2 = cv2.add(mikuu, mikuuu1)
cv_show('mikuuu2', mikuuu1)
?两者的区别:因为像素点的取值在0-255之间,如果用数组的值直接相加,每个像素点的结果都会自动对256取余。而如果使用函数add相加,则值超过255的像素点将会保留255
?3.图像融合
?图像融合前,需保证两张图片的大小一致,这就涉及一个缩放的操作
### 在python中使用
cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)
InputArray src | 输入图片 | OutputArray dst | 输出图片 | Size | 输出图片尺寸 | fx, fy | 沿x轴,y轴的缩放系数 | interpolation | 插入方式 |
?注意:Size是必须传入的参数,传入类型是一个元组!
?插入方式具体参数如下:
INTER_NEAREST | 最近邻插值 | INTER_LINEAR | 双线性插值(默认设置) | INTER_AREA | 使用像素区域关系进行重采样。(在缩小时使用) | INTER_CUBIC | 4x4像素邻域的双三次插值 | INTER_LANCZOS4 | 8x8像素邻域的Lanczos插值 |
### 函数原型
void cv::addWeighted ( InputArray src1,
double alpha,
InputArray src2,
double beta,
double gamma,
OutputArray dst,
int dtype = -1
)
### 在python中使用
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma, dst, dtype)
?该函数可用一个公式表示:
dst = src1 * alpha + src2 * beta + gamma
?注意:alpha和beta表示两幅图像各自的权重,权重越高像素点的值越大,也就越明亮
miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
rin = cv2.imread('C://Users//rwhite//Pictures//_20210810092925.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
cv_show('rin', rin)
res = cv2.addWeighted(miku, 0.6, rin, 0.4, 2)
cv_show('res', res)
?3.图像阈值——threshold
### 函数原型
double cv::threshold( InputArray src,
OutputArray dst,
double thresh,
double maxval,
int type
)
### 在python中使用
retval, dst = cv2.threshold( src, thresh, maxval, type, dst )
type的具体设置如下:
cv2.THRESH_BINARY | 超过阈值部分取maxval(最大值),否则取0 | cv2.THRESH_BINARY_INV | THRESH_BINARY的反转 | cv2.THRESH_TRUNC | 大于阈值部分设为阈值,否则不变 | cv2.THRESH_TOZERO | 大于阈值部分不改变,否则设为0 | cv2.THRESH_TOZERO_INV | THRESH_TOZERO的反转 |
注意:返回值有两个,第一个表示执行成功与否,第二个才是处理后的图像!
img = cv2.imread('C://Users//rwhite//Pictures//opencv//_20210511202744.jpg', cv2.IMREAD_COLOR)
ret, img1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, img2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, img3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, img4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, img5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
title = ['ORIGINAL', 'THRESH_BINARY', 'THRESH_BINARY_INV', 'THRESH_TRUNC', 'THRESH_TOZERO', 'THRESH_TOZERO_INV']
imgg = [img, img1, img2, img3, img4, img5]
for i in range(6):
plt.subplot(2,3,i+1), plt.imshow(imgg[i])
plt.title(title[i])
plt.xticks([]),plt.yticks([])
plt.show()
|