IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 神经网络数据增强transforms的相关操作(持续更新) -> 正文阅读

[人工智能]神经网络数据增强transforms的相关操作(持续更新)

一、图像的相关变化

1、格式转换

(1)transforms.ToTensor()

可将PIL格式、数组格式转换为tensor格式

img_path = "E:\expression_recognition\\2.jpg"
img = Image.open(img_path)  # #数组类型PIL类型都可
a1 = transforms.ToTensor()
img_tensor = (img)

(2)transforms.ToPILImage()

tensor格式 或者 数组类型的数据转换为 PIL 格式

img_path="E:\expression_recognition\\1.jpg"
img = Image.open(img_path)
img_array = numpy.array(img)
a1 = transforms.ToTensor()
img_tensor = a1(img)

# 1、数组转换为PIL格式
a2 = transforms.ToPILImage()
img_array = numpy.uint8(img_array)  # 满足类型需求
img_PIL = a2(img_array)

# 2、tensor转换为PIL格式
img_tensor = img_tensor.float()  # 满足类型需求
img_PIL = a2(img_tensor)

(3)transforms.Normalize()

注意该操作只能对tensor格式进行操作,因此放transforms.ToTensor()之后
对图像进行标准化处理

括号中的值transforms.Resize()
mean,std以三通道为例:[0.5,0.5,0.5],[0.5,0.5,0.5]

2、图像大小和颜色变换

(1)transforms.Resize()

可对tensor类型,PIL类型进行缩放,不可对数组类型进行缩放

括号中的值transforms.Resize()
W图片缩放为(W*W)
(H,W)图片缩放为(H*W)
a = transforms.Resize([256,512])   # [H,W]
img_resize = a2(img)
img_resize.show()

在这里插入图片描述

(2)transforms.ColorJitter()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改

括号中的值transforms.ColorJitter(brightness, contrast, saturation, hue)
brightness亮度
contrast对比度
saturation饱和度
hue色调
a3 = transforms.ColorJitter(brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
img_colorjitter = a3(img)
img_colorjitter.show()

左端原图,右端变换完的图

(3)transforms.Grayscale()和transforms.RandomGrayscale()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改

功能
transforms.Grayscale()将图像变为灰度图像
transforms.RandomGrayscale()将图像随机变为灰度图像
a4 = transforms.Grayscale(num_output_channels=1)
img_grayscale = a4(img)
img_grayscale.show()
a5 = transforms.RandomGrayscale(p=0.1)
img_randomgrayscale = a5(img)
img_randomgrayscale.show()

3、图像的裁剪与旋转

(1)随机裁剪transforms.RandomCrop()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改
随机裁剪有很多参数,但是目前用到的只有这一种参数

参数功能
size按照所给的size大小进行裁剪,size可以是(h,w)或直接是w
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a6 = transforms.RandomResizedCrop((124,124))
a7 = transforms.RandomResizedCrop(256)
img_randomresizedcrop1 = a6(img)
img_randomresizedcrop2 = a7(img)
plt.subplot(1,3,1),plt.imshow(img),plt.title("原图")
plt.subplot(1,3,2),plt.imshow(img_randomresizedcrop1),plt.title("转换后的图1")
plt.subplot(1,3,3),plt.imshow(img_randomresizedcrop2),plt.title("转换后的图2")
plt.show()

(2)中心裁剪transforms.CenterCrop()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改
与随机裁剪基本一样,只不过是从中心进行裁剪

参数功能
size按照所给的size大小进行中心裁剪,size可以是(h,w)或直接是w

(3)随机长宽比裁剪transforms.RandomResizedCrop()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改
主要用到以下两个参数:

参数功能
size输出的分辨率大小
scale随机crop的大小区间,如scale=(0.8, 1.0)(前面是h的倍数,后面是w的倍数),表示随机crop出来的图片会在的0.8倍至1倍之间
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a6 = transforms.RandomResizedCrop((64,128), scale=(0.08, 1.0))
img_randomresizedcrop = a6(img)
plt.subplot(1,2,1),plt.imshow(img),plt.title("原图")
plt.subplot(1,2,2),plt.imshow(img_randomresizedcrop),plt.title("转换后的图")
plt.show()

(4)概率水平翻转transforms.RandomHorizontalFlip()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改

import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a7 = transforms.RandomHorizontalFlip(p=0.5)
img_randomhorizontalflip = a7(img)
plt.subplot(1,2,1),plt.imshow(img),plt.title("原图")
plt.subplot(1,2,2),plt.imshow(img_randomhorizontalflip),plt.title("翻转后的图")
plt.show()
参数功能
p随机水平翻转的概率

(5)概率垂直翻转transforms.RandomVerticalFlip()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改

参数功能
p随机垂直翻转的概率
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a7 = transforms.RandomVerticalFlip(p=0.5)
img_randomverticalflip = a7(img)
plt.subplot(1,2,1),plt.imshow(img),plt.title("原图")
plt.subplot(1,2,2),plt.imshow(img_randomverticalflip),plt.title("翻转后的图")
plt.show()

(6)随机旋转:transforms.RandomRotation()

可对tensor类型,PIL类型进行修改,不可对数组类型进行修改

参数功能
70旋转范围为:(-70,70)
(30,60)旋转范围为:(30,60)
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a7 = transforms.RandomRotation((30,50))
img_randomrotation = a7(img)
plt.subplot(1,2,1),plt.imshow(img),plt.title("原图")
plt.subplot(1,2,2),plt.imshow(img_randomrotation),plt.title("随机旋转后的图")
plt.show()

4、transforms.Compose([])

transforms.Compose是将上述数据变换包装起来依次执行。另外有不对的地方望指出。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:47:25  更:2022-03-13 21:50:10 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:42:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码