[人工智能] 存在感逐渐降低的池化层—

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 存在感逐渐降低的池化层——Pooling Layer总结 -> 正文阅读

[人工智能]存在感逐渐降低的池化层——Pooling Layer总结

文章目录

1. Pooling的作用

下采样（Down-sampling），降维、去冗杂信息
扩大感受野（Enlarge the receptive field）
- 其实和卷积层的效果是类似的，只是卷积核变为了max函数，整体而言还是在扩大感受野
提取边缘信息
实现特征不变性invariance:translation、rotation、scale(平移、旋转和尺度不变性)

说明：上图表示不同水平/垂直位置的值进行池化操作值后得到的结果相同

说明：上图表示不同方位角的特征图经过两次pooling之后得到的结果相同

说明：上图表示不同尺度的特征图经过pooling之后仍然得到了相同的结果

添加非线性，在一定程度上防止过拟合（看到max pooling其实第一个出现脑海中的应该有ReLu激活函数）

2. 各种不同的Pooling

1. max pooling（最大池化层）

$y_{kij} = max_{(p,q) \in R_{ij}}x_{kpq}$
其中 $y_{kij}$ 表示第k个特征图有关于矩形区域 $R_{ij}$ 的最大池化层的输出值， $x_{kpq}$ 表示矩形区域中位于位置 $x_{kpq}$ 的元素。

2. average pooling （平均池化层）

$y_{kij} = \frac{1}{R_{ij}}\sum_{(p,q)\in R_{ij}}x_{kpq}$

average pooling和max pooling的数值区别：

根据一些理论，特征提取的误差主要来源于：
- (1) 邻域大小受限而造成的估计值方差增大
- (2) 卷积层参数误差造成估计值均值偏移
- 一般而言，average-pooling 可以减小第一种误差，最大程度保留图像的背景信息，而max-pooling可以减小第二种误差，保留更多的纹理信息。

总结：

通常我们会倾向于使用max pooling，因为max-pooling在直觉上是在做特征选择，提取最明显的特征来代替整体；而average pooling更像是在做特征融合，将不同的特征进行融合在一起了，其实是模糊了一些强的特征。

3. Global Average Pooling（全局平均池化层）

M lin等人提出使用Global Average Pooling层替代最后的全连接层，用很小的代价实现了降维，其公式同average pooling，但是不用划分矩形区域，而是在整个特征图中进行操作

4. mix pooling（混合池化层）

$y_{ij} = \lambda . max_{(p,q)\in R_{ij}}x_{kpq} + (1-\lambda).\frac{1}{\vert R_{ij} \vert}\sum_{(p,q)\in R_{ij}}x_{kpq}$

用随机过程替代常规的确定池化过程，在模型训练过程中随机选择max和average pooling方法进行池化，在一定程度上有助于防止过拟合
说明：mix/hybrid pooling方法比传统的max/average pooling方法是更优秀的，其需要的额外开销可以忽略不计，也不需要进行参数调整，可以较为广泛的应用于CNN。

5. stochastic pooling(随机池化)

过程如下：

(1) 将矩形内元素除以其sum，得到概率矩阵（伪）
(2) 按照概率选取矩阵内数据
(3) 按照上面的概率随机采样选择内部数据

说明：

随机池化按照特征图内的数值大小进行概率划分，但是选择的数字并非最大值一成不变，而是根据概率选择，原则上仍然是数值越大概率越大，但是选择其他值的概率也存在，所以范化性也更好。

6. Local Importance-based pooling（局部重要性池化层）

用处：

CNN通常使用下采样来缩小特征空间，但是在一些特别的任务中可能会丢失一些重要的细节，损失模型精度。使用regional pooling可以一定程度上缓和。操作为：在下采样的过程中自动增加特征判别功能

其中F的大小和特征I的大小一致，代表每一个点的重要性。
图中分别代表的是Average pooling、max pooling和stride为2的convolution。
- 最大池化对应的值不一定是具有最具区分力的特征
- 步长为2的卷积问题在于固定的采样位置

池化操作可以归纳为：
$O_{x',y'} = \frac{\sum_{(\Delta x,\Delta y)\in\Omega}F(I)_{x+\Delta x,y+\Delta y}I_{x+\Delta x,y+\Delta y}}{\sum_{(\Delta x,\Delta y)\in \Omega}F(I)_{x+\Delta x ,y+ \Delta y}}$
局部重要池化结构可以表示为：
$O_{x',y'} = \frac{\sum_{(\Delta x,\Delta y)\in\Omega}I_{x+\Delta x,y+\Delta y}exp(G(I))_{x+\Delta x,y+\Delta y}}{\sum_{(\Delta x,\Delta y)\in \Omega}exp(G(I))_{x+\Delta x ,y+ \Delta y}}$