此文章为记录pytorch中图像增广技术,方便此后查阅,无参考价值
请参考pytorch 官方说明 1)变换的组合,要想将多个变换组合在一起,请使用Compose 2)在中心剪裁给定的图像CenterCrop(size) , 3)随机更改图像的亮度、对比度、饱和度和色度ColorJitter(brightness=0, contrast=0, saturation=0, hue=0) ,参数为浮点数或者tuple,例如0.5表示(0.5,1.5)的改变 4)以给定的概率随机水平翻转给定的图像RandomHorizontalFlip(p=0.5) 5)裁剪图像的随机部分并将其调整为给定大小RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=<InterpolationMode.BILINEAR: 'bilinear'>) scale: ( tuple of python:float ) – 在调整大小之前指定裁剪随机区域的下限和上限。比例是相对于原始图像的区域定义的。 ratio: ( tuple of python:float ) – 在调整大小之前,裁剪的随机纵横比的下限和上限 interpolation: ( InterpolationMode ) – 所需的插值枚举由 torchvision.transforms.InterpolationMode. 默认为InterpolationMode.BILINEAR 6)按角度旋转图像,RandomRotation(degrees, interpolation=<InterpolationMode.NEAREST: 'nearest'>, expand=False, center=None, fill=0, resample=None degree: ( sequence or number ) – 可供选择的度数范围。如果度数是一个数字而不是像 (min, max) 这样的序列,度数的范围将是 (-degrees, +degrees)。 expand:( bool , optional ) – 可选扩展标志。如果为真,则扩展输出以使其足够大以容纳整个旋转图像。如果为 false 或省略,则使输出图像与输入图像大小相同。请注意,扩展标志假定围绕中心旋转并且没有平移 center: ( sequence , optional ) – 可选的旋转中心,(x, y)。原点是左上角。默认是图像的中心 fill ( sequence or number ) – 旋转图像外区域的像素填充值。默认为0。如果给定一个数字,该值将分别用于所有波段。 7)将输入图像调整为给定大小。Resize(size) 8)使用随机选择的高斯模糊来模糊图像。GaussianBlur(kernel_size, sigma=(0.1, 2.0)) kernel_size: ( int or sequence ) – 高斯核的大小。 sigma: ( float or tuple of python:float ( min , max ) ) – 用于创建内核以执行模糊的标准偏差。如果浮动,则 sigma 是固定的。如果是 float (min, max) 的元组,则 sigma 被随机均匀地选择在给定的范围内 9)用均值和标准差对张量图像进行归一化。Normalize(mean, std, inplace=False) mean: ( sequence ) – 每个通道的均值序列。 std: ( sequence ) – 每个通道的标准差序列。 10)将张量或 ndarray 转换为 PIL Image。ToPILImage(mode=None) 将张量或 ndarray 转换为 PIL Image。此转换不支持 torchscript。
将形状为 C x H x W 的张量或形状为 H x W x C 的 numpy ndarray 转换为 PIL 图像,同时保留值范围。 11)ToTensor 将或转换为张量
|