图像基础
灰度图: 彩色图:
- 通道分离与合并
b, g, r = cv.split(img)
img_new = cv.merge([b, g, r])
- 彩色图转灰度图
img_gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
- 二值化图像
_, img_bin = cv.threshold(img_gray, th1, th2, cv.THRESH_BINARY)
- 图像运算
img = cv.add(img1, img2)
img = cv.addWeighted(img1, alpha, img2, beta, gamma)
img = cv.subtract(img1, img2)
img = cv.multiply(img1, img2)
img = cv.divide(img1, img2)
- 图像像素非线性变换
img = cv.convertScaleAbs(img, alpha=1, beta=0)
s
=
b
+
k
r
s = b + kr
s=b+kr
s
=
a
+
l
n
(
r
+
1
)
b
s = a + \frac{ln(r+1)}{b}
s=a+bln(r+1)?
s
=
c
r
γ
s = cr^\gamma
s=crγ
重要的函数
- 图像读取
img = cv.imread()
- 彩色图转灰度图
img_gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
- 二值化图像(灰度图转二值图)
_, img_bin = cv.threshold(img_gray, th1, th2, cv.THRESH_BINARY)
- 保存图像
cv.imwrite('pic/bear_gray.jpg', img_gray)
- 通道分离
b, g, r = cv.split(img)
- 通道合并
img_new = cv.merge([b, g, r])
- 两图像相加、相减、相乘、相除
img = cv.add(img1, img2)
img = cv.subtract(img1, img2)
img = cv.multiply(img1, img2)
img = cv.divide(img1, img2)
图像基本知识
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
def show(img):
if img.ndim == 2:
plt.imshow(img, cmap='gray',vmin=0,vmax=255)
else:
plt.imshow(cv.cvtColor(img, cv.COLOR_BGR2RGB))
plt.show()
图像基础
A = np.random.randint(0,256,(2,4))
A
array([[ 4, 245, 223, 220],
[191, 208, 190, 72]])
show(A)
B = np.random.randint(0,256,(2,4,3),dtype=np.uint8)
B
array([[[240, 57, 37],
[141, 33, 113],
[ 50, 252, 5],
[125, 23, 206]],
[[ 94, 128, 166],
[218, 183, 231],
[156, 136, 105],
[208, 191, 119]]], dtype=uint8)
uint8为8位无符号整数类型,表示范围为[0, 255]
show(B)
A2 = np.float32(A)
A2 /= 255
show(A2)
通道分离与合并
读取图片
img = cv.imread('./pic/cubic500x500.jpg')
show(img)
通道分离
b,g,r = cv.split(img)
show(r)
img.shape
(500, 500, 3)
通道合并
img2 = cv.merge([b,g,r])
show(img2)
img3 = cv.merge([r,g,b])
show(img3)
彩色图转换为灰度图
将三个通道进行加权
gray1 = 1/3*b + 1/3*g + 1/3*r
gray1 = np.uint8(gray1)
利用cv现成的api
gray4 = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
show(gray4)
二值化
thresh = 125
gray4[gray4 > thresh] = 255
gray4[gray4 <= thresh] = 0
show(gray4)
利用cv.threshold来进行二值化
show(gray1)
_, img_bin = cv.threshold(gray1, 125, 255, cv.THRESH_BINARY)
show(img_bin)
图像的加减乘除
np.hstack 将参数元组的元素数组按水平方向进行叠加
np.vstack 将参数元组的元素数组按垂直方向进行叠加
接下来,我们进行代码的实现
obj = cv.imread('./pic/hedgehog500x500.jpg',0)
bg = cv.imread('./pic/line500x500.jpg',0)
mask = cv.imread('./pic/mask500x500.jpg',0)
noise = cv.imread('./pic/hedgehog_noise_500x500.jpg',0)
show(np.hstack([obj,bg,mask,noise]))
接下来,我们呢可以图像相加以及图像相减的效果:
图像相加:
img_add = obj + bg
show(img_add)
显然得到的图,并不是我们想要的,这是因为img_add = obj + bg ,两个图的RGB元素相加超过了255时,会重新循环到另外一个值,我们只需要两者都取权重0.5,就可以避免这样的问题
img_add = obj*0.5 + bg*0.5
show(img_add)
print(img_add.dtype)
float64
但是这里注意,obj0.5 + bg0.5后,img_add的数据类型会自动转换为float类型,你也可以使用np.uint8()进行强制转换
但是,调用cv.addWeighted(),就不会出现这样的情况,它会自动的截断
img_add2 = cv.addWeighted(obj,0.5,bg,0.5,0)
show(img_add2)
图像相减:
img_sub = np.uint8((img_add - bg*0.5))
show(np.hstack([img_sub,img_sub*2]))
图像乘法
show(np.hstack([obj, mask]))
img_mul = cv.multiply(obj/1.0, mask/255)
show(img_mul)
图像相除
show(np.hstack([obj, ob_noise]))
img_div = cv.divide(obj, ob_noise+1)
show(img_div)
保存图片
cv.imwrite('pic/img_divide.jpg', np.hstack([obj, noise, img_div]))
True
bg = cv.imread('pic/petal500x500.jpg')
ob = cv.imread('pic/hedgehog500x500.jpg')
mask = cv.imread('pic/mask500x500.jpg')
show(np.hstack([bg, ob, mask]))
ob_select = np.float32(ob/1.0) * np.float32(mask/255.0)
show(np.uint8(ob_select))
bg_select = np.float32(bg/1.0) * np.float32(1-mask/255.0)
show(np.uint8(bg_select))
nice = cv.add(ob_select*0.8, bg_select).astype(np.uint8)
show(nice)
cv.imwrite('pic/image_mix.jpg', np.hstack([bg, ob, nice]))
True
|