数据增强(Data Augmentation)
我们常常会遇到数据不足的情况。比如,你遇到的一个任务,目前只有小几百的数据,然而,你知道目前现在流行的最先进的神经网络都是成千上万的图片数据。 为了获得更多的数据,我们只要对现有的数据集进行微小的改变。比如旋转(flips)、移位(translations)、旋转(rotations)等微小的改变。我们的网络会认为这是不同的图片。 一个卷积神经网络,如果能够对物体即使它放在不同的地方也能稳健的分类,就被称为具有不变性的属性。更具体的,CNN可以对移位(translation)、视角(viewpoint)、大小(size)、照明(illumination)(或者以上的组合)具有不变性。 这本质上是数据增强的前提。在现实场景中,我们可能会有一批在有限场景中拍摄的数据集。但是我们的目标应用可能存在于不同的条件,比如在不同的方向、位置、缩放比例、亮度等。
import matplotlib.pyplot as plt
import torchvision
from PIL import Image
path = ["imgs/1.jpg"]
for index, p in enumerate(path):
plt.subplot(2,2,1+index)
img_array = Image.open(p)
print("原始图像大小为:",img_array.size)
new_img_array = torchvision.transforms.Grayscale()(img_array)
trans_totensor = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])
img_tensor = trans_totensor(new_img_array)
print(img_tensor.shape)
plt.imshow(new_img_array)
plt.show()
原始图像大小为: (486, 500) torch.Size([1, 500, 486])
|