IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【医学分割】unet3+ -> 正文阅读

[人工智能]【医学分割】unet3+

概述

unet3+是在unet以及unet++的基础上提出来的,unet的核心是skip-connection。
而unet++也正是在这个核心上做的改动,使用了重叠的稠密卷积代替粗暴的特征融合。
而unet3+注意到,unet和unet++没有直接从多尺度信息中提取足够多的信息,基于这一点,设计了一种新的skip-connection的结构,更好的将低级细粒度信息和高级语义特征进行了融合,并且这种结构的参数量会比unet和unet++都少。同时,对于decoder的输出进行深度监督,并且提出了一种新的损失函数进行训练。另一方面,使用分类做了指导,降低在背景图中过度分割的情况。
unet和unet++没有直接从多尺度信息中提取足够多的信息指的是,unet是根据对应层的encoder的输出以及下一层decoder上采样的结果构造当前层decoder的,没有进行了多尺度信息的利用;而unet++虽然通过嵌套和密集跳过连接进行了多尺度信息的利用,但是更像是对于encoder特征的不断处理,而不是对原始特征的利用;unet3+则是对原始特征进行了多尺度信息的利用。
以下就是三种结构的比较示意图:
在这里插入图片描述

细节

Full-scale Skip Connections

在这里插入图片描述
unet3+还是在unet基础上改动得到的,故他依然是encoder-decoder的结构。encoder部分其实unet,unet++还有unet3+都是相同的,关键是decoder部分是怎么得到的。unet3+中的做法是,encoder中层数小于等于当前层的特征图经过池化(无重叠最大池化)和卷积操作得到64个通道的特征图(当然,层数相同的那一层不需要池化操作),然后decoder中层数大于当前层的特征图经过上采样(双线性插值)和卷积同样得到64个通道的特征图,接着将这些特征图concat起来,以作者采用的5层结构为例,总共会有64x5=320,这320个通道数的特征图,经过卷积、正则化、和激活函数之后就构成了decoder的一层了。
上述过程的形式化表述就是:
在这里插入图片描述
并且,有一个不得不提的是,尽管unet3+的结构相对于unet会复杂,但是在保证相同的encoder的基础上,参数量反而会少。也就是保证相同的encoder,参数量排名是:unet3+<unet<unet++

Full-scale DeepSupervision

unet3+和unet++都采用深度监督,从多尺度聚合的特征图中学习层次表示,但是监督的位置信息不同哟,这点从图中的sup位置就能发现。unet++对第一层特征图进行监督,具体的操作是在这些特征图的后面都接c(C是类别个数)个1x1的卷积核和一个sigmoid函数,得到最后的分割结果;而unet3+则是对decoder的每一个层对应一个侧输出,这个输出经过3x3的卷积、上采样和sigmoid函数,得到分割的结果。其中上采样是为了得到全尺寸的特征图,使用相同的gt进行监督。

在这里插入图片描述

开发了一种混合损失用于在三级层次结构(像素级、补丁级和图片级)中进行分割,它能捕获大尺度的和精细结构清晰的边界,损失函数:是MS-SSIM loss+focal loss+ IoU loss,其中

  • 多尺度结构相似性指数 (MM-SSIM) 损失用于为模糊边界分配更高的权重。
  • Focal loss起源于RetinaNet,用于处理类不平衡问题。
  • 使用标准IoU 损失。

Classification-guided Module

在这里插入图片描述
在encoder的最后一层或者说是decoder的最后一层,经过dropout、1x1卷积、最大池化和sigmoid函数得到两个值,然后经过argmax函数转换成单个输出,表示有或者没有目标,然后我们将这个输出与侧分割相乘,得到更加准确的分割结果。解决由于较浅层中背景噪声等残留信息导致过分割的现象

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-29 19:04:19  更:2022-06-29 19:05:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/29 9:21:44-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计