SSD-经典的one stage


1.SSD结构

? 
? 上图所示的为SSD网络的结构图,前面的部分为VGG-16网络的一部分(对比上方的网络图可知),输出卷积层4_3作为第一级的38*38大小的特征层输出,继续进行卷积处理分别得到19*19、10*10、5*5、3*3、1*1大小的特征层输出,共六个不同大小的输出,用来预测不同大小的物体,因为大的特征图细节更加丰富故,大的物体使用小的特征图进行预测,小的物体使用大的特征图预测,下面是对不同大小的特征图预测框的生成尺寸的选择。

? 可以看到最终得到的预测框的数目有8732个,每个通过一个3*3*(Classes+4)大小的卷积核得到预测的种类的得分,以及预测框位置的回归参数。

2.正负样本的选取
正样本:1.用真实的目标框去匹配IOU最大的预测框;2.预测框与真实框的IOU值大于0.5。
负样本:对于剩下的负样本计算最大置信损失(highest confidence loss),损失值越大证明越接近正样本,选取其中损失值最大的一些,使负样本与正样本的比例为3:1。
3.损失函数

? 损失分为类别损失和定位损失两个部分,下面是SSD的类别损失,定位损失与Faster R-CNN的定位损失计算方法相同。

|