论文:EfficientDet: Scalable and Efficient Object Detection
创新点
问题
-
在FPN中不能有效的进行多尺度特征融合,虽然后来也有一些论文研究跨尺度的特征融合,但是也只是将特征进行简单的相加并没有加以区分; -
作者观察到由于不同的特征具有不同的分辨率,所以它们对于特征融合的输出贡献也会不相同; -
在以前的目标检测中主要依靠更大的主干网络和更大的图像分辨率,但是作者观察到缩放特征网络的大小和框/类别预测网络对于正确率和效率也很重要。
方法
BiFPN
删除仅有一个输入节点: 当一个节点只有一个输入而没有特征融合时那么它对于整个融合特征模块是没有帮助的,删除节点还有助于下降参数了;
残差链接: 如果节点处在相同层级就添加一条从输入到输出的边,旨在不添加成本的情况下融合更多特征;
双向路径: 与PANet不同,PANet仅有一条自下而上和自上而下的路径,BiFPN将每个双向(自下而上和自上而下)路径视为一个特征网络层,并多次重复同一层以实现更高级别的特征融合。
Weighted Feature Fusion
在特征融合方面相比于以往的融合方法,作者提出加权特征融合。使具有不同的分辨率的不同特征对所输出的特征融合结果产生不同的比重。 加权特征融合使用Fast Fusion,他可以将每一个归一化权重落在0到1之间,并且没有softmax,保证准确度的同时在GPU上提高了30%的速度。
EfficientDet
受EfficientNet启发提出了一种针对于目标检测的复合缩放方法,该方法可以通过一个参数(φ)来调整所有的主干网络、特征网络、框/类别预测网络的分辨率、深度和宽度。
用于网络宽度和深度方面进行缩放。 用于在框/分类预测网络中的框和类别数量公式。
用于输入图像分辨率方面。 EfficientDet网络分为三个部分,分别为EfficientNets作为主干网络,BiFPN 作为特征网络和框/类别预测网络。BiFPN从主干网络中获取 3-7 级特征{P3、P4、P5、P6、P7},BiFPN 和框/类网络层都可以重复多次。
|