[人工智能] PIL.Image、cv2以及pytorch图像格式比较

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> PIL.Image、cv2以及pytorch图像格式比较 -> 正文阅读

[人工智能]PIL.Image、cv2以及pytorch图像格式比较

在python中，PIL.Image、cv2以及pytorch都可以对图像进行处理，那么这三种方式读取图片输出的格式以及显示方式有哪些不同呢，一起来探究下。

一、PIL

提前准备一张JPG格式的，大小为427×640（H×W）的彩色图片进行测试：

import torch
import torch.nn as nn
import torch.nn.functional as F
import cv2
import numpy as np
from PIL import Image

img_pil = Image.open('demo.jpg')
img_pil.show()
print(f'img_pil type is:{type(img_pil)}, img_pil shape is {img_pil.size}') #(W, H)

输出（忽略图片）：

img_pil type is:<class 'PIL.JpegImagePlugin.JpegImageFile'>, img_pil shape is (640, 427)

可以看出，Image读入图片后格式是JpegImagePlugin.JpegImageFile类型的，且shape为(W, H)，不显示通道数。

二、cv2

img_cv = cv2.imread('demo.jpg')
cv2.imshow('img_cv',img_cv)
cv2.waitKey(0) # 按0关闭窗口
print(f'img_cv type is:{type(img_cv)}, img_cv shape is {img_cv.shape}') #(H, W, C)

输出（按0关闭图片窗口）：

img_cv type is:<class 'numpy.ndarray'>, img_cv shape is (427, 640, 3)

可以看出，cv2读入图片后格式是Jndarray类型的，且shape为(H, W, C)。值得注意的是cv2显示图片时，是非阻塞的，如果不显式地使用waitKey，图片将会一闪而过。

三、pytorch

此处使用二维的卷积来处理图片，使用pytorch中的nn模块可以轻易地构造出一个卷积。由于卷积只接收tensor类型的输入，所以仍然使用出cv2先将图像读过来，经过卷积层处理后，取前三个feature map转化为ndarray显示出来：

img_cv = cv2.imread('demo.jpg')
conv = nn.Conv2d(in_channels=3,out_channels=64,kernel_size=3,padding=1) # 构造卷积
img_reshape = np.reshape(img_cv, (-1, 3, 427, 640)) # reshape成nn需要的shape
img_tensor = torch.tensor(img_reshape).float() # 将ndarray转化为Tensor
img_conv = conv(img_tensor)
print(f'img_conv type is:{type(img_conv)}, img_conv shape is {img_conv.shape}')
img_array = img_conv[0,:3].reshape(427, 640, 3).detach().numpy() # 取前三个feature map
cv2.imshow('img_array',img_array)
cv2.waitKey(0)

输出：

img_cv type is:<class 'numpy.ndarray'>, img_cv shape is (427, 640, 3)
img_conv type is:<class 'torch.Tensor'>, img_conv shape is torch.Size([1, 64, 427, 640])