IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数字图像与机器视觉基础补充(2) -> 正文阅读

[人工智能]数字图像与机器视觉基础补充(2)

@TOC

一、彩色图像转换

(一)彩色图像文件转换为灰度文件

1.使用OpenCV

引入包以及文件路径

#文件路径
#导入相关包
import cv2
import numpy as np
source_path="F:\\Anaconda3\\project\\jupyter\\picture\\lena.png"

使用opencv,直接读取为灰度图片

#使用opencv
#直接读取灰度图片
cv_read=cv2.imread(source_path,0)
cv2.imshow('lena',cv_read)
cv2.waitKey(0)

结果如下:
请添加图片描述
使用opencv,读取彩色,再转为灰度

#读取彩色图片,后面转换为灰度
cv_read=cv2.imread(source_path)
cv_gray=cv2.cvtColor(cv_read,cv2.COLOR_BGR2GRAY)#灰度化
cv2.imshow('lena',cv_gray)
cv2.waitKey(0)

结果如下:
请添加图片描述

2.不使用OpenCV

不使用opencv的转换函数

#不使用opencv
row,col,channel=cv_read.shape
lena_gray=np.zeros((row,col))
for r in range(row):
    for l in range(col):
        lena_gray[r,l]=1/3*cv_read[r,l,0]+1/3*cv_read[r,l,1]+1/3*cv_read[r,l,2]
cv2.imshow("lena",lena_gray.astype("uint8"))
cv2.waitKey(0)

请添加图片描述

(二)彩色图像(RGB)转为HSV、HSI 格式

1.转为HSV格式

#使用opencv
#直接读取图片
cv_read=cv2.imread(source_path)
#转化为hsv格式
lena_hsv=cv2.cvtColor(cv_read,cv2.COLOR_BGR2HSV)
cv2.imshow('lena',lena_hsv)
cv2.waitKey(0)

结果如下:
请添加图片描述

2.转为HSI格式

def RBG_to_HSI(rgb_img):
    """
    : param rgb_img: RGB彩色图像
    : return       : HSI图像
    """
    #保存原始图像的行列数
    row=np.shape(rgb_img)[0]
    col=np.shape(rgb_img)[1]
    #对原始图像进行复制
    hsi_img=rgb_img.copy()
    #对图像进行通道拆分
    B,G,R=cv2.split(rgb_img)
    #把通道归一化到[0,1]
    [B,G,R]=[i/255.0 for i in ([B,G,R])]
    H=np.zeros((row,col))#定义H通道
    I=(R+G+B)/3.0        #计算I通道
    S=np.zeros((row,col))#定义S通道
    for i in range(row):
        den = np.sqrt((R[i]-G[i])**2+(R[i]-B[i])*(G[i]-B[i]))
        thetha=np.arccos(0.5*(R[i]-B[i]+R[i]-G[i])/den)#计算夹角
        h=np.zeros(col)  #定义临时数组
        #den>0且G>=B的元素h赋值为thetha
        h[B[i]<=G[i]]=thetha[B[i]<=G[i]]
        #den>0且G<=B的元素h赋值为thetha
        h[G[i]<=B[i]]=2*np.pi-thetha[G[i]<=B[i]]
        #den<0的元素h赋值为0
        h[den==0]=0
        H[i]=h/(2*np.pi) #弧度化之后赋值给H通道
    for i in range(row):
        min_=[]
        #找出每组RGB的最小值
        for j in range(col):
            arr=[B[i][j],G[i][j],R[i][j]]
            min_.append(np.min(arr))
        min_=np.array(min_)
        #计算S通道
        S[i]=1-min_*3/(R[i]+B[i]+G[i])
        #I为0的值直接赋值0
        S[i][R[i]+B[i]+G[i]==0]=0
    #扩充到255以方便显示,一般H分量在[0,2pi]之间,S和I在[0,1]之间
    hsi_img[:,:,0]=H*255
    hsi_img[:,:,1]=S*255
    hsi_img[:,:,2]=I*255
    return hsi_img
    
#调用函数
#使用opencv
#读取图片
cv_read=cv2.imread(source_path)
lena_hsi=RBG_to_HSI(cv_read)
cv2.imshow('lena',lena_hsi)
cv2.waitKey(0)

请添加图片描述

二、车牌数字分割

图片如下所示
请添加图片描述

代码如下:

import os
import shutil
import cv2
import numpy as np

file_path = "F:\\Anaconda3\\project\\jupyter\\plate\\car\\"
licenses = os.listdir(file_path)
for license in licenses:
    path = file_path+license
    output_path = "F:\\Anaconda3\\project\\jupyter\\plate\\"+license # 图片输出路径
    # 如果该路径存在则删除
    if os.path.isdir(output_path):
        shutil.rmtree(output_path)
    # 创建文件夹
    os.mkdir(output_path)

    # 1.读取图片
    src = cv2.imread(path)
    img = src.copy()
    # 2.去除车牌上螺丝,将其替换为车牌底色
    cv2.circle(img, (145, 20), 10, (255, 0, 0), thickness=-1)
    cv2.circle(img, (430, 20), 10, (255, 0, 0), thickness=-1)
    cv2.circle(img, (145, 170), 10, (255, 0, 0), thickness=-1)
    cv2.circle(img, (430, 170), 10, (255, 0, 0), thickness=-1)
    cv2.circle(img, (180, 90), 10, (255, 0, 0), thickness=-1)

    # 3.灰度
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    
    # 4.高斯滤波
    GSblurred = cv2.GaussianBlur(gray, (5, 5), 12)

    # 5.将灰度图二值化设定阈值
    ret, thresh = cv2.threshold(GSblurred , 127, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
    print("ret",ret)

    # 6. 闭运算
    kernel = np.ones((3, 3), int)
    closed = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel,iterations=2)
    #二值化
    ret, thresh = cv2.threshold(closed, 127, 255, cv2.THRESH_BINARY+ cv2.THRESH_OTSU)
    # 7.分割字符
    white = [] # 记录每一列的白色像素总和
    black = [] # ..........黑色.......
    height = thresh.shape[0]
    width = thresh.shape[1]
    white_max = 0
    black_max = 0
    # 计算每一列的黑白色像素总和
    for i in range(width):
      s = 0 # 这一列白色总数
      t = 0 # 这一列黑色总数
      for j in range(height):
        if thresh[j][i] == 255:
          s += 1
        if thresh[j][i] == 0:
          t += 1
      white_max = max(white_max, s)
      black_max = max(black_max, t)
      white.append(s)
      black.append(t)
      # print(s)
      # print(t)

    arg = False  # False表示白底黑字;True表示黑底白字
    if black_max > white_max:
        arg = True

    # 分割图像
    def find_end(start_):
        end_ = start_ + 1
        for m in range(start_ + 1, width - 1):
            if (black[m] if arg else white[m]) > (0.95 * black_max if arg else 0.95 * white_max):  # 0.95这个参数请多调整,对应下面的0.05
                end_ = m
                break
        return end_

    n = 1
    start = 1
    end = 2
    i=0;
    cj=[]

    while n < width - 2:
        n += 1
        if (white[n] if arg else black[n]) > (0.05 * white_max if arg else 0.05 * black_max):
            # 上面这些判断用来辨别是白底黑字还是黑底白字
            # 0.05这个参数请多调整,对应上面的0.95
            start = n
            end = find_end(start)
            n = end
            if end - start > 5:
                cj.append(thresh[1:height, start:end])
                cv2.imwrite(output_path + '/' + str(i) + '.jpg', cj[i])
                i += 1;

运行结果:
请添加图片描述
请添加图片描述
请添加图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-08 14:00:00  更:2022-01-08 14:00:25 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 17:49:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码