IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文解析[2] UNet++: A Nested U-Net Architecture for Medical Image Segmentation -> 正文阅读

[人工智能]论文解析[2] UNet++: A Nested U-Net Architecture for Medical Image Segmentation

论文地址:https://arxiv.org/pdf/1807.10165.pdf

论文概要

提出了UNet++:一种更有效的医学图像分割结构。它是一种深度监督的编码-解码器网络,编码器和解码器通过一系列嵌套、稠密的跳跃路径连接。

重新设计的跳跃路径旨在减小编码器和解码器特征图之间的语义鸿沟。我们认为当编码器和解码器特征图之间的语义鸿沟更小时,优化器就会处理一个更简单的学习任务。

我们在不同的医学图像分割任务上评估UNet++,并与U-Net、wide U-Net对照。实验证明了带有深度监督的UNet++模型比U-Net、wide U-Net的平均IoU高出3.9和3.4。

1 介绍

目前图像分割性能最好的模型都是编码器-解码器结构的变形,像U-Net和FCN。这些网络有一个关键的共同点:跳跃连接,它可以将解码器的深层、语义、粗粒度特征图和编码器的浅层、低水平、细粒度特征图结合。跳跃连接在恢复目标物体细粒度细节、生成分割掩膜方面被证明是有效的。它也是instance-level分割模型成功的基础

但是分割医学图像中的病变和异常需要比自然图像中更高的准确率。为了解决需求,我们提出了UNet++,一种基于嵌套和稠密跳跃连接的结构。

这种结构背后的基本假说是,当编码器网络的高分辨率特征图与解码器网络的语义丰富的特征图融合之前逐渐丰富时,该模型可以更有效的捕获前景对象的细粒度细节。

对比于使用普通跳跃连接的U-Net,U-Net直接将高分辨率的特征图从编码器快进传入解码器,导致了语义不相似的特征图融合。

2 相关工作

FCN、U-Net、H-denseunet

GridNet、Mask-RCNN

3 提出的网络模型

在这里插入图片描述
UNet++包括编码器和解码器,它们通过一系列嵌套稠密的卷积块连接。UNet++的主要想法是在融合之前减小编码器和解码器特征图之间的语义鸿沟。

区分UNet++和U-Net(黑色部分)的是重新设计的跳跃路径(绿色和蓝色部分)和深度监督(红色部分)的使用

3.1 重新设计的跳跃路径

在这里插入图片描述
x i , j x^{i,j} xi,j 代表节点 X i , j X^{i,j} Xi,j 的输出, i i i 是编码器的下采样层的索引, j j j 跳跃路径上卷积层的索引

H ( ) H() H() 表示一个卷积操作后面跟随一个激活函数, μ ( ) μ() μ() 表示一个上采样层, [ ? ] [~] [?] 表示连接层

  • j = 0 j=0 j=0 时,节点仅接收来自上一层编码器的一个输入。
  • j = 1 j=1 j=1 时,接收来自编码器两个不同层的两个输入。
  • j > 1 j>1 j>1 时,接收 j + 1 j+1 j+1 个输入,其中 j j j 个来自于相同跳跃路径的前 j j j 个节点,最后一个输入是低一层跳跃路径的上采样输出。

3.2 深度监督

使用深度监督可以使模型能够在两个模式运行:

  1. 准确模式,输出来自于所有分割分支的均值
  2. 快速模式,最后的分割图像仅来自于分割分支中的一个(分支的选择决定了模型的修剪程度和速度增益)

由于稠密的跳跃路径,UNet++生成全分辨率特征图于不同的语义水平, { x 0 , j , j ∈ { 1 , 2 , 3 , 4 } } \{x^{0,j},j∈\{1,2,3,4\}\} {x0,j,j{1,2,3,4}}

我们使用了二分交叉熵和骰子系数的结合来作为以上四个语义水平中每一个的损失函数:
在这里插入图片描述
如图1a所示,UNet++与U-Net有三处区别:

1)在跳跃路径有卷积层(绿色),减小了编码器和解码器特征图之间的语义鸿沟

2)跳跃路径有稠密的跳跃连接(蓝色),提高了梯度流

3)有深度监督(红色),可以使模型修剪和提升,或者在最坏的情况下实现与仅使用一个损失层相当的性能。

4 实验

数据集
在这里插入图片描述
模型
在这里插入图片描述
作为对照,我们使用了原始U-Net和一个特定的wide U-Net(与建议的结构有相似的参数)。

结果
在这里插入图片描述
在四个数据集上的正确率

在这里插入图片描述
分割比较

模型修剪

在这里插入图片描述
展示了在不同程度修剪后的模型性能

如图所示, L 3 L^3 L3 平均减少了32.2%的推理时间,但IoU只降低了0.6。进一步的修剪会减少推理时间,但代价是显著的正确率下降。

5 结论

  • 为解决医学图像分割更高准确率的需求,我们提出了UNet++
  • 这种结构利用了重新设计的跳跃路径和深度监督。(重新设计的跳跃路径旨在减小编码器和解码器之间的语义鸿沟,使优化问题更简单。深度监督能够更精确的分割,特别是多尺度出现的病变)
  • 我们在四个医学图像数据集上评估了UNet++,比U-Net和wide U-Net的平均IoU高出了3.9和3.4

参考资料

论文精读:UNet++:https://zhuanlan.zhihu.com/p/543874630
深度学习论文精读[6]:UNet++:https://blog.csdn.net/weixin_37737254/article/details/125923940
FCN、Unet、Unet++医学图像分割那点事儿:https://zhuanlan.zhihu.com/p/159173338?from=singlemessage
【论文笔记】医学图像分割 U-Net++:https://blog.csdn.net/muyijames/article/details/117438141

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-21 00:29:07  更:2022-09-21 00:31:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 22:36:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码