开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 2，一个人体姿态识别的项目实现 -> 正文阅读

[人工智能]2，一个人体姿态识别的项目实现

文档说明：

参考链接：
http://codec.wang/#/opencv/start/02-basic-element-image

1，认识

简单地放几张图片感受一下，opencv识别的人体
本项目基于pycharm python3.6 和anaconda4.0做的，仅供参考
在这里插入图片描述

2，start，直接干货

先来看一下这三个函数：

加载图片，显示图片，保存图片
OpenCV函数：

cv2.imread(参数1，参数2), 如img = cv2.imread('IU.jpg',0)

	加载成功显示图片，没有找到图片返回none，
	参数1，照片名字如： xx.jpg
	参数2：读入方式，省略即采用默认值
	cv2.IMREAD_COLOR：彩色图，默认值(1)
	cv2.IMREAD_GRAYSCALE：灰度图(0)
	cv2.IMREAD_UNCHANGED：包含透明通道的彩色图(-1)

cv2.imshow(参数1，参数2),如：cv2.imshow('IU',img)

cv2.imwrite()，如cv2.imwrite('IU.jpg', img)

例子1

显示一个图片的灰度图，挑选一张图片保存到这个工程下面即可

# -*- coding: utf-8 -*-

import cv2

img = cv2.imread('IU.jpg',0)#加载成功显示图片，没有找到图片返回none，第二个参数0看最后几行介绍
cv2.namedWindow('IU', cv2.WINDOW_NORMAL)#建立一个IU的窗口，参数2默认是cv2.WINDOW_AUTOSIZE，表示窗口大小自适应图片，也可以设置为cv2.WINDOW_NORMAL，表示窗口大小可调整。图片比较大的时候，可以考虑用后者。
cv2.imshow('IU',img)
cv2.waitKey(0) #让窗口显示停留 参数是等待时间（毫秒ms）。时间一到，会继续执行接下来的程序，传入0的话表示一直等待

例子2

学习打开摄像头捕获照片、播放本地视频、录制视频等

打开摄像头并捕获照片
播放本地视频，录制视频
OpenCV函数：cv2.VideoCapture(), cv2.VideoWriter()

打开摄像头，并灰度化显示，键盘上按q退出

# 打开摄像头并灰度化显示
import cv2

capture = cv2.VideoCapture(0)

while(True):
    # 获取一帧
    ret, frame = capture.read()
    # 将这帧转换为灰度图
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    # 获取捕获的分辨率
    # propId可以直接写数字，也可以用OpenCV的符号表示
    width, height = capture.get(3), capture.get(4)
    print(width, height)

    # 以原分辨率的一倍来捕获
    # capture.set(cv2.CAP_PROP_FRAME_WIDTH, width * 2)
    # capture.set(cv2.CAP_PROP_FRAME_HEIGHT, height * 2)
    if cv2.waitKey(1) == ord('q'):
        break

灰度播放一段视频：

# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')

while(capture.isOpened()):
    ret, frame = capture.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    if cv2.waitKey(30) == ord('q'):
        break

录制视频：

capture = cv2.VideoCapture(0)

# 定义编码方式并创建VideoWriter对象
fourcc = cv2.VideoWriter_fourcc(*'MJPG')#FourCC是用来指定视频编码方式的四字节码。如MJPG编码可以这样写
outfile = cv2.VideoWriter('output.avi', fourcc, 25., (640, 480))#输出的文件名，如'output.avi'
编码方式FourCC，帧率FP，要保存的分辨率大小

while(capture.isOpened()):
    ret, frame = capture.read()

    if ret:
        outfile.write(frame)  # 写入文件
        cv2.imshow('frame', frame)
        if cv2.waitKey(1) == ord('q'):
            break
    else:
        break

例子3

ROI
ROI：Region of Interest，感兴趣区域。什么意思呢？比如我们要检测眼睛，因为眼睛肯定在脸上，所以我们感兴趣的只有脸这部分，其他都不care，所以可以单独把脸截取出来，这样就可以大大节省计算量，提高运行速度。

获取图像的ROI区域，如获取下图图片左眼的区域
在这里插入图片描述
先找到眼睛区域的值：运行下面代码然后移动鼠标获取像素点的x,y的值并记录下来
我记录的x，y的值为：53,122 ————106,169

import cv2

img = cv2.imread('pic.jpg',1)

cv2.imshow('face', img)
cv2.waitKey(0)

然后切记img【先是y，后是x】，行对应y，列对应x，所以其实是img[y, x]，需要注意噢(●ˇ?ˇ●)。容易混淆的话，可以只记行和列，行在前，列在后。

import cv2

img = cv2.imread('pic.jpg',1)

p = img[ 120:170, 50:100]
cv2.imshow('face', p)
cv2.waitKey(0)

在这里插入图片描述
下一个例子

import cv2

img = cv2.imread('IU.jpg',1)

p = img[ 594:835, 270:595]
cv2.imshow('face', p)

# cv2.namedWindow('IU', cv2.WINDOW_NORMAL)
# cv2.imshow('IU',img)  #先运行注释掉的代码，用鼠标缺点脸部区域的坐标


cv2.waitKey(0)

在这里插入图片描述

通过行列的坐标来获取某像素点的值，对于彩色图，结果是B,G,R三个值的列表，对于灰度图或单通道图，只有一个值：

px = img[100, 90]
print(px)  # [103 98 197]

# 只获取蓝色blue通道的值
px_blue = img[100, 90, 0]
print(px_blue)  # 103

例子4

提取下面这张图的蓝色部分

HSV是一个常用于颜色识别的模型，相比BGR更易区分颜色，转换模式用COLOR_BGR2HSV表示。
cv2.cvtColor()函数用来进行颜色空间转换，常用BGR?Gray，BGR?HSV。
HSV颜色模型常用于颜色识别。要想知道某种颜色在HSV下的值，可以将它的BGR值用cvtColor()转换得到。

在这里插入图片描述

import cv2
import numpy as np

img = cv2.imread('color_blue.png',1) #图片导入

# 蓝色的范围，不同光照条件下不一样，可灵活调整
lower_blue = np.array([100, 110, 110])
upper_blue = np.array([130, 255, 255])

hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV) #BGR转HSV
mask = cv2.inRange(hsv, lower_blue, upper_blue) #inRange()：介于lower/upper之间的为白色，其余黑色
res = cv2.bitwise_and(img, img, mask=mask)#只保留原图中的蓝色部分

cv2.imshow('img', img)
cv2.imshow('mask', mask)
cv2.imshow('res', res)
cv2.waitKey(0)

那蓝色的HSV值的上下限lower和upper范围是怎么得到的呢？其实很简单，我们先把标准蓝色的BGR值用cvtColor()转换下：

blue = np.uint8([[[255, 0, 0]]])
hsv_blue = cv2.cvtColor(blue, cv2.COLOR_BGR2HSV)
print(hsv_blue)  # [[[120 255 255]]]

结果是[120, 255, 255]，所以，我们把蓝色的范围调整成了上面代码那样。

例子5

使用固定阈值、自适应阈值和Otsu阈值法"二值化"图像

固定阈值

分割很直接，一句话说就是像素点值大于阈值变成一类值，小于阈值变成另一类值。
在这里插入图片描述

自适应阈值

看得出来固定阈值是在整幅图片上应用一个阈值进行分割，它并不适用于明暗分布不均的图片。 cv2.adaptiveThreshold()自适应阈值会每次取图片的一小部分计算阈值，这样图片不同区域的阈值就不尽相同。
在这里插入图片描述

OpenCV函数：

 cv2.threshold()#如：进行固定阈值分割，ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

 cv2.adaptiveThreshold()#进行自适应阈值分割，它有6个参数，如th2 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)

**cv2.threshold()**用来进行固定阈值分割。固定阈值不适用于光线不均匀的图片
所以用 cv2.adaptiveThreshold()进行自适应阈值分割。
二值化跟阈值分割并不等同。针对不同的图片，可以采用不同的阈值方法。

**cv2.threshold()**用来实现阈值分割，ret是return value缩写，代表当前的阈值，暂时不用理会。函数有4个参数：

参数1：要处理的原图，一般是灰度图
参数2：设定的阈值
参数3：对于THRESH_BINARY、THRESH_BINARY_INV阈值方法所选用的最大阈值，一般为255
参数4：阈值的方式，主要有5种

cv2.adaptiveThreshold()
参数1：要处理的原图
参数2：最大阈值，一般为255
参数3：小区域阈值的计算方式
ADAPTIVE_THRESH_MEAN_C：小区域内取均值
ADAPTIVE_THRESH_GAUSSIAN_C：小区域内加权求和，权重是个高斯核
参数4：阈值方法，只能使用THRESH_BINARY、THRESH_BINARY_INV，具体见前面所讲的阈值方法
参数5：小区域的面积，如11就是11*11的小块
参数6：最终阈值等于小区域计算出的阈值再减去此值


# 应用5种不同的阈值方法
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)//二分
ret, th2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)//倒置二分
ret, th3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)//切割
ret, th4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)//切割二分
ret, th5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)//倒置切割二分

分别为：'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV'''

这五种阈值方式分别为：
在这里插入图片描述

——————————————————————————————

使用如下图片进行固定阈值分割：

import cv2

# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 阈值分割
ret, th = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)#可更改127的值看看，参数2的值越小，黑色区域越少
cv2.imshow('thresh', th)
cv2.waitKey(0)

在这里插入图片描述

import cv2

# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 阈值分割
ret, th = cv2.threshold(img, 80, 255, cv2.THRESH_BINARY)
ret, th2 = cv2.threshold(img, 80, 255, cv2.THRESH_BINARY_INV)#倒置二分
cv2.imshow('thresh', th)
cv2.imshow('thresh2', th2)
cv2.waitKey(0)

在这里插入图片描述
先把代码复制进去，然后根据错误提示，点击波浪线安装matplotlib包即可。

import cv2
import matplotlib.pyplot as plt


# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 应用5种不同的阈值方法
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, th2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, th3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, th4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, th5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, th1, th2, th3, th4, th5]

# 使用Matplotlib显示
for i in range(6):
    plt.subplot(2, 3, i + 1)
    plt.imshow(images[i], 'gray')
    plt.title(titles[i], fontsize=8)
    plt.xticks([]), plt.yticks([])  # 隐藏坐标轴

plt.show()

在这里插入图片描述

————————————————————————————————
用自适应阈值来处理一个数独图片
————————————————————————————————

import cv2
import matplotlib.pyplot as plt
# 自适应阈值对比固定阈值
img = cv2.imread('zishiying.png', 0)

# 固定阈值
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 自适应阈值
th2 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)
th3 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 17, 6)

titles = ['Original', 'Global(v = 127)', 'Adaptive Mean', 'Adaptive Gaussian']
images = [img, th1, th2, th3]

for i in range(4):
    plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i], fontsize=8)
    plt.xticks([]), plt.yticks([])
plt.show()