torch.nn.functional.grid_sample(input, grid, mode=‘bilinear’, padding_mode=‘zeros’, align_corners=None)
举个例子,input的shape为[1, 128, 124, 186], 可以知道
N
=
1
,
C
=
128
,
H
i
n
=
124
,
W
i
n
=
186
N=1, C=128, H_{in}=124,W_{in}=186
N=1,C=128,Hin?=124,Win?=186
现在想从input中采些值出来,形成一个2285x1的一维特征向量,
H
o
u
t
=
2285
,
W
o
u
t
=
1
H_{out}=2285, W_{out}=1
Hout?=2285,Wout?=1
所以grid的shape为[1, 2285, 1, 2] 最后一个维度2是(x, y)坐标,注意是(x, y)而不是(h, w),它们是行列互换的关系。 而且(x, y)坐标是归一化到[-1, 1]内的:[-1, -1]对应input的左上角,[1, 1]对应input的右下角,(x, y)可以不是整数。 看官网关于维度的解释
For each output location output[n, :, h, w], the size-2 vector grid[n, h, w] specifies input pixel locations x and y,
把grid中(x, y)坐标对应的每个C中input的值,填入到对应C的output中。因为grid的(x, y)坐标可以不是整数,所以要用到插值, 插值方法通过mode选定,比如双线性插值’bilinear’。
前面说(x, y)坐标要归一化到[-1, 1],如果超出了这个范围,要用到padding。
|