为提高缺陷检测性能,将SE模块添加到YOLOv5的主干网络,将激活函数ReLU替换为ACON
YOLOv5
YOLO算法将图像换分为多个区域,制定边界框并同时预测属于某个类的对象的概率,是一个基于深度学习的单阶段目标检测算法,glenn-jocher引入了YOLOv5,它默认平等对待整个特征映射的每个区域,即每个区域对最终检测结果的贡献相同。YOLOv5模型中较小的模型具有较少的参数,较低的精度和更快的速度。为了更好地满足织物缺陷检测对精度的要求,所以选择了YOLOv5x模型作为改进的模型。
注意力机制
注意力机制在许多任务重具有很强的实用性,包括序列学习、定位和图像字幕。SE模块包括一个轻量级的门控机制,通过以一种计算高效的方式建立关系,专注于增强网络的表示能力。
激活函数
ReLU是近年来使用最广泛的激活函数。ReLU在零处是不可微分的,在其他地方都是可以微分的。在整个域上具有非零梯度的Leaky ReLU与标准整流器dnn的性能几乎相同。后来提出一种简单、有效、通用的激活函数ACON,学习是否激活神经元。ACON是在各种任务重有效的激活函数,自然可以转移到目标检测中。
SE-YOLOv5
在SE-YOLOv5中,将SE模块添加到YOLOv5骨干网中,并引入ACON激活函数以取代YOLOv5 CSP的Leaky ReLU激活函数。
网络结构如下图:
?SE-YOLOv5可分为骨干、颈、预测三部分。在主干中,输入图像通过Focus块,它执行一个切片操作。CBL由卷积层、批量归一化和sigmoid线性单元(SiLU)激活函数组成。空间金字塔池(SPP)块主要增加网络的接受场,获取不同尺度的特征。它使用最大池化方法来执行组合操作。通过这种组合操作,将不同比例的特征图串联起来。结合不同特征层的特征图,提高网络检测不同尺度目标的能力。
ACON-CSP
将YOLOv5 CSP结构的Leaky ReLU函数替换为ACON激活函数,称为ACON-CSP。
ACON-CSP模块主要对特征图进行特征提取,从图像中提取丰富的信息。与其他大规模卷积神经网络相比,ACON-CSP结构可以减少优化过程中的梯度信息重复。
ACON-CSP模块的组成:
使用天池竞赛中的数据集,达到了95.52%的整体检测精度,优于YOLOv5.
?
?结果表明,SE-YOLOv5收敛速度快,训练损失基本收敛到稳定值。
结论
?与原来的YOLOv5相比,改进后的模型SE-YOLOv5在检测织物缺陷方面具有更高的精度、泛化能力和鲁棒性。
|