声明:此篇文章是个人学习笔记,并非教程,所以内容可能不够严谨。可作参考,但不保证绝对正确。如果你发现我的文章有什么错误,非常欢迎指正,谢谢哦
平均池化层,又叫平均汇聚层,作用:https://blog.csdn.net/weixin_42193719/article/details/103860206
每次会计算滑动窗口覆盖区域内数值的平均值,然后将滑动窗口滑向下一个区域计算下一个平均值,如此反复直到滑动到末尾。
nn.AvgPool2d
torch.nn.AvgPool2d(kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True, divisor_override=None)
参数 | 功能 |
---|
kernel_size | 滑动窗口的大小 | stride | 滑动步长,默认等于kernel_size | padding | 在图像边缘添加0边 | ceil_mode | 当滑动窗口滑动后有一部分不在图像范围内时,是否会计算平均值 | count_include_pad | 如果为True,则0边会参与平均值计算 | divisor_overrid | 默认是求多个元素后除以元素个数,也就是求平均值。这里可以设置新的除数,即多元元素求和后除以这个数,但这样就不是求平均值了。 |
nn.AdaptiveAvgPool2d
torch.nn.AdaptiveAvgPool2d(output_size)
参数 | 功能 |
---|
output_size | 指定输出特征层的尺寸。可以用元组(H,W)指定输出为HxW的特征,也可以用单个数H表示输出为HxH的特征 |
二者区别
nn.AvgPool2d()需要我们自己指定核(滑动窗口)的大小、步长等参数,输出特征的尺寸取决于我们给定的窗口大小、步长等参数。
而AdaptiveAvgPool2d()会根据我们想要的输出,自行计算核的大小。我们只需要说明我们想要的输出尺寸是多少,它会自动调整滑动窗口大小等参数去实现我们的要求。
代码验证
data = torch.tensor(
[[[[9.0, 0, 7,6],
[3,2,6,8],
[7,5,4,4],
[4,8,3,5]],
[[3,8,7,2],
[9,6,1,2],
[2,0,8,0],
[2,9,8,4]]]]
)
ada_avg = torch.nn.AdaptiveAvgPool2d(1)
print('ada_avg',ada_avg(data))
avg = torch.nn.AvgPool2d(kernel_size=4)
print('avg:',avg(data))
ada_avg = torch.nn.AdaptiveAvgPool2d((2,3))
print('ada_avg',ada_avg(data))
avg = torch.nn.AvgPool2d(kernel_size=2, stride=(2,1))
print('avg:',avg(data))
所以呢,当我们希望不管输入尺寸是什么样都要得到同样尺寸的输出结果时,或者懒得自己计算时(?),就可以使用AdaptiveAvgPool2d() 。
|