IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> pytorch——transforming and augmenting images(转换和图像增强) -> 正文阅读

[人工智能]pytorch——transforming and augmenting images(转换和图像增强)

此文章为记录pytorch中图像增广技术,方便此后查阅,无参考价值

请参考pytorch 官方说明
1)变换的组合,要想将多个变换组合在一起,请使用Compose
2)在中心剪裁给定的图像CenterCrop(size),
3)随机更改图像的亮度、对比度、饱和度和色度ColorJitter(brightness=0, contrast=0, saturation=0, hue=0),参数为浮点数或者tuple,例如0.5表示(0.5,1.5)的改变
4)以给定的概率随机水平翻转给定的图像RandomHorizontalFlip(p=0.5)
5)裁剪图像的随机部分并将其调整为给定大小RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=<InterpolationMode.BILINEAR: 'bilinear'>)
scale: ( tuple of python:float ) – 在调整大小之前指定裁剪随机区域的下限和上限。比例是相对于原始图像的区域定义的。
ratio: ( tuple of python:float ) – 在调整大小之前,裁剪的随机纵横比的下限和上限
interpolation: ( InterpolationMode ) – 所需的插值枚举由 torchvision.transforms.InterpolationMode. 默认为InterpolationMode.BILINEAR
6)按角度旋转图像,RandomRotation(degrees, interpolation=<InterpolationMode.NEAREST: 'nearest'>, expand=False, center=None, fill=0, resample=None
degree: ( sequence or number ) – 可供选择的度数范围。如果度数是一个数字而不是像 (min, max) 这样的序列,度数的范围将是 (-degrees, +degrees)。
expand:( bool , optional ) – 可选扩展标志。如果为真,则扩展输出以使其足够大以容纳整个旋转图像。如果为 false 或省略,则使输出图像与输入图像大小相同。请注意,扩展标志假定围绕中心旋转并且没有平移
center: ( sequence , optional ) – 可选的旋转中心,(x, y)。原点是左上角。默认是图像的中心
fill ( sequence or number ) – 旋转图像外区域的像素填充值。默认为0。如果给定一个数字,该值将分别用于所有波段。
7)将输入图像调整为给定大小。Resize(size)
8)使用随机选择的高斯模糊来模糊图像。GaussianBlur(kernel_size, sigma=(0.1, 2.0))
kernel_size: ( int or sequence ) – 高斯核的大小。
sigma: ( float or tuple of python:float ( min , max ) ) – 用于创建内核以执行模糊的标准偏差。如果浮动,则 sigma 是固定的。如果是 float (min, max) 的元组,则 sigma 被随机均匀地选择在给定的范围内
9)用均值和标准差对张量图像进行归一化。Normalize(mean, std, inplace=False)
mean: ( sequence ) – 每个通道的均值序列。
std: ( sequence ) – 每个通道的标准差序列。
10)将张量或 ndarray 转换为 PIL Image。ToPILImage(mode=None)
将张量或 ndarray 转换为 PIL Image。此转换不支持 torchscript。

将形状为 C x H x W 的张量或形状为 H x W x C 的 numpy ndarray 转换为 PIL 图像,同时保留值范围。
11)ToTensor 将或转换为张量

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-06 11:03:14  更:2022-05-06 11:05:58 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/4 15:00:54-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码