IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 通道分离与合并、彩色图转换为灰度图、二值化 -> 正文阅读

[人工智能]通道分离与合并、彩色图转换为灰度图、二值化

图像基础

  • 矩阵
  • 分辨率
  • 8位整型图像
  • 浮点数图像

在这里插入图片描述
灰度图:
在这里插入图片描述
彩色图:

在这里插入图片描述

  1. 通道分离与合并
b, g, r = cv.split(img)
img_new = cv.merge([b, g, r])
  1. 彩色图转灰度图
img_gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
  1. 二值化图像
_, img_bin = cv.threshold(img_gray, th1, th2, cv.THRESH_BINARY)
  1. 图像运算
img = cv.add(img1, img2)
img = cv.addWeighted(img1, alpha, img2, beta, gamma)
img = cv.subtract(img1, img2)
img = cv.multiply(img1, img2)
img = cv.divide(img1, img2)
  1. 图像像素非线性变换
img = cv.convertScaleAbs(img, alpha=1, beta=0)

s = b + k r s = b + kr s=b+kr

s = a + l n ( r + 1 ) b s = a + \frac{ln(r+1)}{b} s=a+bln(r+1)?

s = c r γ s = cr^\gamma s=crγ

重要的函数

  1. 图像读取
img = cv.imread()
  1. 彩色图转灰度图
img_gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
  1. 二值化图像(灰度图转二值图)
_, img_bin = cv.threshold(img_gray, th1, th2, cv.THRESH_BINARY)
  1. 保存图像
cv.imwrite('pic/bear_gray.jpg', img_gray)
  1. 通道分离
b, g, r = cv.split(img)
  1. 通道合并
img_new = cv.merge([b, g, r])
  1. 两图像相加、相减、相乘、相除
img = cv.add(img1, img2)
img = cv.subtract(img1, img2)
img = cv.multiply(img1, img2)
img = cv.divide(img1, img2)

图像基本知识

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
def show(img):
    if img.ndim == 2:
        plt.imshow(img, cmap='gray',vmin=0,vmax=255)
    else:
        plt.imshow(cv.cvtColor(img, cv.COLOR_BGR2RGB))#cv用的BGR,需要转换为RGB
    plt.show()

图像基础

A = np.random.randint(0,256,(2,4))
A
array([[  4, 245, 223, 220],
       [191, 208, 190,  72]])
show(A)

在这里插入图片描述

B = np.random.randint(0,256,(2,4,3),dtype=np.uint8)
B
array([[[240,  57,  37],
        [141,  33, 113],
        [ 50, 252,   5],
        [125,  23, 206]],

       [[ 94, 128, 166],
        [218, 183, 231],
        [156, 136, 105],
        [208, 191, 119]]], dtype=uint8)

uint8为8位无符号整数类型,表示范围为[0, 255]

show(B)

在这里插入图片描述

A2 = np.float32(A)
A2 /= 255
show(A2)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IreIgOD4-1662470402352)(output_13_0.png)]

通道分离与合并

读取图片

img = cv.imread('./pic/cubic500x500.jpg')
show(img)

在这里插入图片描述

通道分离

b,g,r = cv.split(img)
show(r)

在这里插入图片描述

img.shape
(500, 500, 3)

通道合并

img2 = cv.merge([b,g,r])
show(img2)

在这里插入图片描述

img3 = cv.merge([r,g,b])
show(img3)

在这里插入图片描述

彩色图转换为灰度图

将三个通道进行加权

gray1 = 1/3*b + 1/3*g + 1/3*r
gray1 = np.uint8(gray1)# 或者gray1 = gray1.astype(np.uint8)

利用cv现成的api

gray4 = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
show(gray4)

在这里插入图片描述

二值化

thresh = 125
gray4[gray4 > thresh] = 255
gray4[gray4 <= thresh] = 0
show(gray4)

在这里插入图片描述

利用cv.threshold来进行二值化

show(gray1)

在这里插入图片描述

_, img_bin = cv.threshold(gray1, 125, 255, cv.THRESH_BINARY)
show(img_bin)

在这里插入图片描述

图像的加减乘除

  • 相加:混合图像、添加噪声cv.add()

  • 相减:消除背景、差影法(比较差异、运动跟踪)cv.subtract()

  • 相乘:掩膜 cv.multiply()

  • 相除:校正设备、比较差异 cv.divide()

np.hstack将参数元组的元素数组按水平方向进行叠加

np.vstack将参数元组的元素数组按垂直方向进行叠加

接下来,我们进行代码的实现

obj = cv.imread('./pic/hedgehog500x500.jpg',0)
bg = cv.imread('./pic/line500x500.jpg',0)
mask = cv.imread('./pic/mask500x500.jpg',0)
noise = cv.imread('./pic/hedgehog_noise_500x500.jpg',0)
show(np.hstack([obj,bg,mask,noise]))

在这里插入图片描述

接下来,我们呢可以图像相加以及图像相减的效果:

图像相加:

img_add = obj + bg
show(img_add)

在这里插入图片描述

显然得到的图,并不是我们想要的,这是因为img_add = obj + bg,两个图的RGB元素相加超过了255时,会重新循环到另外一个值,我们只需要两者都取权重0.5,就可以避免这样的问题

img_add = obj*0.5 + bg*0.5 #img_add = cv.add(obj*0.5,bg*0.5)
show(img_add)

在这里插入图片描述

print(img_add.dtype)
float64

但是这里注意,obj0.5 + bg0.5后,img_add的数据类型会自动转换为float类型,你也可以使用np.uint8()进行强制转换

但是,调用cv.addWeighted(),就不会出现这样的情况,它会自动的截断

img_add2 = cv.addWeighted(obj,0.5,bg,0.5,0)
show(img_add2)

在这里插入图片描述

图像相减:

img_sub = np.uint8((img_add - bg*0.5))
#img_sub = cv.subtract(img_add,bg*0.5)
show(np.hstack([img_sub,img_sub*2]))

在这里插入图片描述

图像乘法

# mask /= 255
show(np.hstack([obj, mask]))

在这里插入图片描述

img_mul = cv.multiply(obj/1.0, mask/255) #cv.multiply只会对同种类型的数据相乘,因此Ob/1.0
show(img_mul) 

在这里插入图片描述

图像相除

# 图像相除
show(np.hstack([obj, ob_noise]))

在这里插入图片描述

img_div = cv.divide(obj, ob_noise+1)
show(img_div)

在这里插入图片描述

保存图片

cv.imwrite('pic/img_divide.jpg', np.hstack([obj, noise, img_div]))
True
# 实例
bg = cv.imread('pic/petal500x500.jpg')
ob = cv.imread('pic/hedgehog500x500.jpg')
mask = cv.imread('pic/mask500x500.jpg')

show(np.hstack([bg, ob, mask]))

在这里插入图片描述

ob_select = np.float32(ob/1.0) * np.float32(mask/255.0)
show(np.uint8(ob_select))

在这里插入图片描述

bg_select = np.float32(bg/1.0) * np.float32(1-mask/255.0)
show(np.uint8(bg_select))

在这里插入图片描述

nice = cv.add(ob_select*0.8, bg_select).astype(np.uint8)
show(nice)
cv.imwrite('pic/image_mix.jpg', np.hstack([bg, ob, nice]))
True
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-13 11:15:05  更:2022-09-13 11:16:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 17:34:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计