论文阅读笔记:Learning Statistical Texture for Semantic Segmentation
论文名称:Learning Statistical Texture for Semantic Segmentation 论文地址:https://arxiv.org/pdf/2103.04133.pdf. 代码链接:https://github.com/lanyunzhu99/Learning-Statistical-Texture-for-Semantic-Segmentation.
一、背景介绍
语义分割主要分为两个主路线: 1、如何更好的提取特征 ① FCN ② DeepLab ③ PSPNet ④ DANet 2、如何更好的结合不同层次的特征 ① Unet ② BiseNet ③ Deeplab V3+ ④ SFNet
二、动机
低层次和高层次的特征都在语义分割任务中发挥着重要的作用,现有的语义分割研究主要关注高层次特征的提取,例如通过各类注意力模型提取全局的上下文信息。然而,对低层次的特征提取方式的研究工作相对较少。
纹理信息包括两种:局部结构信息(卷积神经网络的提取)和全局统计信息(直方图等的统计信息)
三、方法
在卷积网络中加入直方图均衡化,利用均衡化后的掩膜乘以原始的特征,来增强特征的表征能力,在本文中,主要提出了两个算子,分别对应两个模块:
1、1-d QCO和TEM模块
2、2-d QCO和PTFEM模块 3、损失函数:
四、总结
① 关注了语义分割任务中的低层次特征提取
② 提出了一种新方法在神经网络中对统计化的纹理特征进行表征并利用
③ 提出的模块具有普适性,能扩展到多种模型结构与任务中
五、补充
实验参数的介绍:
① FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 ② FLOPs:注意s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。
|