IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [论文阅读] TGANet: Text-guided attention for improved polyp segmentation -> 正文阅读

[人工智能][论文阅读] TGANet: Text-guided attention for improved polyp segmentation

[论文地址] [代码] [MICCAI 22]

Abstract

结肠镜检查是一个黄金标准,但高度依赖操作者。自动息肉分割可以最大限度地减少漏诊率,并在早期阶段及时治疗结肠癌。即使有为这项任务开发的深度学习方法,但息肉大小的变化会影响模型的训练,从而将其限制在训练数据集中大多数样本的大小属性上,可能会给不同大小的息肉提供次优结果。在这项工作中,我们在训练过程中以文本注意力的形式利用与尺寸相关和息肉数量相关的特征。我们引入了一个辅助的分类任务,对基于文本的嵌入进行加权,使网络能够学习额外的特征表征,能够明显适应不同大小的息肉,并能够适应有多个息肉的情况。我们的实验结果表明,与最先进的分割方法相比,这些增加的文本嵌入提高了模型的整体性能。我们探索了四个不同的数据集,并提供了针对具体尺寸的改进意见。我们提出的文本引导的注意力网络(TGANet)可以很好地概括不同数据集中不同大小的息肉。

I. Network Architecture

在这里插入图片描述
本文的息肉分割网络算是比较复杂的一类。具体来说,主要引入了以下几个模块:

接下来我们分别对其分析。

II. Encoder

采用预训练的resnet50作为backbone(而非息肉分割任务中常见的res2net)。需要注意的是,本文似乎去掉了resnet最后一个encoder block;此外,该encoder还承担了两个额外的任务。一个是二分类,判断图像中息肉的数量(单个/多个);另一个是三分类,判断图像中息肉的大小(小,中,大)。

不过,本文并未阐明监督分类任务所需的标签从何获得,笔者猜测可能需要人工标注,感兴趣的读者可以研究其开源代码进行分析。

III. Feature Enhancement Module

对encoder获得的特征进行进一步的增强处理。这一模块可以说是非常常见了,基本每个做分割的都要设计个类似attention的东西处理特征:
在这里插入图片描述

IV. Label Attention

该模块是本文思想的核心。具体来说,是文中的这一部分:
在这里插入图片描述
结构事实上比较复杂,因此我们这里只介绍思想。首先引入一个语义类别(Semantic Class)的概念,即,如果对息肉执行一个分类任务,那么各图像大致可以分为五类:单息肉,多息肉,小息肉,中息肉,大息肉。这一类别可以通过上文的分类获得。现在,实际上就出现了一个隐含的类别不均衡问题。如果一个模型在大息肉上表现很好,但在小息肉上表现不佳,可能有多种原因,比如说小息肉的特征比较难学,又或者小息肉的样本数量很小…那这个时候,我们就可以利用attention思想,对这种"目前学习不足"的特征进行重点学习,从而提升整体的性能。之前获得的个图像样本的语义类别统计信息就可以为这一过程提供指导,此所谓"Text-Guided Attention"。

V. Multi-Scale Feature Aggregation

也算是分割任务中十分经典的多级特征融合,这里不进行赘述:
在这里插入图片描述

VI. Experiment

需要注意的是,本文所用的数据集和"主流息肉分割论文"并不相同,为Kvasir-SEG,CVCClinicDB,BKAI,Kvasir-Sessile。注意Kvasir-Sessile实际上是Kvasir-SEG的一个子集,因此实际上只用了三个数据集。此外,对比的方法也为较旧的方法,作为一篇2022年的论文,并未对比21年的sota息肉分割方法。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-01 15:13:42  更:2022-06-01 15:16:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 4:32:25-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码