论文:https://arxiv.org/pdf/2105.04714.pdf 代码:
论文工作
指出训练数据采样和计算分布策略(training data sampling and computation distribution strategies)是高效和准确的人脸检测的关键,基于此提出: (1)样本再分配(Sample Redistribution, SR),基于基准数据集的统计,在最需要的阶段增加训练样本; (2)计算再分配(computing Redistribution, CR),它基于一种精心定义的搜索方法,在模型的脊柱、颈部和头部之间重新分配计算。
论文第一张图很重要,旨在表明SCRFD的计算量少,效果却非常好: 在困难的WIDER FACE 数据集样本里,一骑绝尘。
Sample Redistribution
作者发现在WIDER FACE难样本数据集里,人脸大小 小于32*32 pixels 的占有78.93%: TinaFace基于RetinaFace,使用ResNet-50 + (FPN) +Focal loss+ Focal loss + cross-entropy loss。 TinaFace-ResNet50 的计算分布如下图,大部分计算成本在stride 4 。TinaFace-ResNet50计算量太大,不太好用。
通过修改随机尺寸到 [0.3, 2.0] ,在stride 8 中产生更多的正样本。 随着将更多的训练样本重新分配到小尺度上,可以更充分地训练用于检测微小人脸的分支。
Computation Redistribution
借助 凯明大神的Designing Network Design Spaces,将计算重新分配到脊柱、颈部和头部。 首先,作者同时固定颈部和头部组件,探讨了计算在主干部分中的重新分配。其次,根据作者发现的主干上的优化计算分布,进一步探讨了计算在脊柱、颈部和头部的重新分配。 具体细节挺复杂,直接看论文描述。
|