一种数据增广的操作
# _*_ coding:utf-8 _*_
import numpy
import numpy as np
from scipy.ndimage.filters import gaussian_filter
from scipy.ndimage.interpolation import map_coordinates
def elastic_transform(image, alpha, sigma, seed=None):
"""
弹性形变
:param image: 图片(h,w)
:param alpha: 放缩因子
:param sigma: 弹性系数
:param seed: 随机种子
:return: 弹性形变后的图片
"""
assert isinstance(image, numpy.ndarray)
shape = image.shape # h*w
assert 2 == len(shape)
if seed is None:
seed = np.random.randint(1, 100)
random_state = np.random.RandomState(seed)
# 生成一个均匀分布(-1,1)的移位场,然后高斯滤波,然后成缩放
dx = gaussian_filter((random_state.rand(*shape) * 2 - 1), sigma) * alpha
dy = gaussian_filter((random_state.rand(*shape) * 2 - 1), sigma) * alpha
# 生成坐标
y, x = np.meshgrid(np.arange(shape[1]), np.arange(shape[0]))
# 偏移
indices = np.reshape(x + dx, (-1, 1)), np.reshape(y + dy, (-1, 1))
# 插值
return map_coordinates(image, indices, order=1).reshape(shape), seed
meshgrid是生成坐标,不过二维的情况,生成的是先y后x
map_coordinates是插值,indices是坐标,如果是一个合法的坐标,就取图片原来的值,否则就插值
最后效果就是会扭曲
右上角是?的随机场和他对应的图片
左下角是的随机场和他对应的图片
右下角是的随机场和他对应的图片
弹性系数较小相当于一个完全的随机场,比较大就相当于仿射变换
论文地址
|