Optic Disc Segmentation Using Attention-Based U-Net and the Improved Cross-Entropy Convolutional Neural Network
使用带注意力的U-Net和改进的交叉熵卷积神经网络的视盘分割
技术:多通道注意力机制,骰子系数与交叉熵结合,卷积神经网络
————————————————————————————————
摘要:
在本文中,我们提出了一种新的聚合通道注意力网络,以充分利用上下文信息对语义分割的影响。与现有的注意力机制不同,我们利用通道依赖性,将不同尺度的信息整合到注意力机制中。同时,改进了基于交叉熵的基本分类框架,将骰子系数和交叉熵相结合,平衡了骰子系数和交叉熵损失对分割任务的贡献,提高了网络在小区域分割中的性能。该网络保留了更多的图像特征,更准确地恢复了重要特征,进一步提高了医学图像的分割性能。我们将其应用于眼底视盘分割任务。我们在梅西多Messidor数据集和RIM-ONE数据集上演示了该模型的分割性能,并对所提出的体系结构进行了评估。
贡献点:
(1) 为了避免过度拟合和节省模型计算,我们建议使用DenseNet块在编码层提取特征。这在数据集通常较小的医学图像分割领域尤为重要。 (2) 我们提出了一种有效的语义分段解码器,称为聚合通道注意力上采样模块。我们使用不同层次的特征来引导注意机制,从而融合不同尺度的信息来恢复像素类别。我们使用压缩激励块和广义平均池来整合信道信息。 (3) 我们改进了基于交叉熵的基本分类框架来优化网络。该损失函数平衡了骰子系数和交叉熵损失对分割任务的贡献。
2.材料与方法
2.1.用于医学图像分割的聚合通道注意网络体系结构
如图1所示,在编码器-解码器网络结构中,编码器旨在逐渐减小特征图的空间大小,并捕获更高级的语义特征。解码器恢复对象的细节和空间维度,并保留更多的空间信息。在众多改进U-Net的算法中,编码器和解码器分别有所改进。为了获得更重要的高级语义特征,我们选择了在编码器路径中表现良好的DenseNet块。同样,在解码路径中,我们提出了一个聚集通道注意上采样(ACAU)模块来保留更多的空间信息。为了提取上下文语义信息并生成更高级的特征,在瓶颈中,我们使用了由多分支原子卷积组成的密集Atrous卷积模块(DAC)和由多尺度池化组成的剩余多尺度池化(RMP)。 图2显示了网络结构框架。与语义分段的典型架构一样,我们的框架(如图2所示)包括一个编码器、一个解码器和一个连接这两部分的瓶颈。首先,通过卷积层提取输入图像的初始特征。初始卷积层为7×7卷积,步长为2,填充为3。在编码器路径中,我们使用DenseNet[22]块结构来提取图像特征。DenseNet块包括稠密块(特征提取)和过渡块(缩小特征图大小)。它由四个DenseNet块组成,用于不同的特征分辨率。瓶颈结构通过密集阿托斯卷积(DAC)和剩余多核池(RMP)进一步提取不同尺度的特征[12]。解码器路径由四个聚合通道注意上采样模块组成,该模块保持编码器的高级特征并恢复特征映射的空间分辨率。最后,对输出特征图进行反卷积、连续ReLU函数和3×3卷积,然后用S形函数进行处理,得到预测图。
2.2.密集卷积编码网络
在U-Net[11]体系结构中,编码是通过连续卷积和池操作实现的。连续的池化操作和卷积降低了特征分辨率,以学习越来越抽象的特征。这种操作阻碍了详细空间信息的密集预测任务。保持高分辨率需要更多的训练资源,因此在节省训练资源和保持高分辨率之间需要权衡。为了捕获更高级的功能,我们需要使用一种编码结构,该结构能够有效地提取高级功能,并且不会占用太多的训练资源。
2.3.聚合通道注意上采样模块
----------------- 图4是聚合通道注意上采样模块(ACAU)--------------------
ACAU中,为了提高网络生成的表示质量,我们在每个上采样块中使用压缩Squeeze和激励块Excitation Block[16],自适应地加权通道,使用全局信息,并选择性地强调信息特征,抑制无用特征。形式上,vl是通过空间尺寸 Hl×Wl 收缩 xl 生成的。
解码模块的主要功能是修复类别像素定位。我们使用具有丰富类别信息的高层面特征对低层面特征进行加权,以选择准确的分辨率细节。
因此,我们对高层面特征实施GeM 池化[27],以提供全局上下文信息来指导低层面特征。
GeM 池化特征描述器 用于生成信道特征响应的全局分布的嵌入[16],以便聚合该层的全局接受域的信息,并使用该信息指导较低层的特征。这可以有效地组合不同分辨率的特征信息,并使用高级特征为低级特征提供指导。
2.4.改进的交叉熵损失法在视盘分割中的应用
在网络结束时,我们执行softmax操作以获得预测图。执行softmax操作以确保预测结果最终映射到(0,1)间隔,该间隔用于表示像素是背景或光盘的概率。
为了利用骰子系数损失来处理不平衡和小面积,同时考虑到交叉熵损失的优点,我们合并了两个函数。 ----------------------------------- 效果展示图--------------------------------------
|