IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 提高图像分割的一些tricks -> 正文阅读

[人工智能]提高图像分割的一些tricks

本文来自于百度的论文

PADDLESEG: A HIGH-EFFICIENTDEVELOPMENTTOOLKIT FORIMAGESEGMENTATION

分割任务中输入与输出的尺寸相同(这点与检测不同)
输入图像中的每个像素都被赋予一个类的标签(伪彩色图像中的不同颜色)分割网络用编码器(encoder)和解码器(decoder)组成。在编码器部分,特征图的大小逐渐减小;在解码器部分,特征图的大小逐渐增大,直到与输入图像有相同的大小。
如何使网络提高分割精度,这篇论文根据目前的现状总结到有5个方法,如下:

  1. Skip connection
    随着输入图像的分辨率下降,输入图像的低层信息丢失,最终编码机输出输入图像的高层信息;解码器只接受高层特征,导致粗分割结果,因此在解码器通过skip connection 将低层和高级特征结合起来,然后解码器通过增强不同级别的特征来获取更详细的信息。
    全卷积网络(FCN)是skip connection的先驱,而U-Net则是进一步推动skip connection 他采用对称的编码器和解码器结构,与FCN不同,U-Net通过使用密集的skip connection 充分利用每一层的特征。
    U-Net引起了医学的关注,现在又有很多U-Net的变形。如 attention U-Net,U-Net++等。FCN网络结构
    U-Net网络结构图

  2. Dilated Convolution
    分辨率随着降采样而逐渐降低,导致结果信息丢失,为了保持分辨率,如果只是单纯的减少下采样的数量,会使计算复杂度急剧增加,接受域的大小不断缩小,导致分割结果也不是很准确。因此引入了空洞卷积,通过保持分辨率和计算复杂度来扩大接受域。

  3. Global context
    除了Dilated convolution,还有一种增加接受域的替代方法,即利用上下文信息,由于卷积本质上是一种局部操作,它往往会导致上下文的缺失,一般来说,上下文信息(远远超出像素集外观)会意思到语义,并为构建分割模型提供一个有用补充源。金字塔池化最初是用在图像分类和目标检测到,然后将其引入到图像分割中,获取不同尺度的上下文信息,扩大接受域,最后结合局部和全局信息辅助决策。(如,在水中的穿在局部视图中可能会被归类为汽车,但结合全局上下文信息,可以正确的分类。如PSPNet以及DeepLab中的ASPP模块,除了局部特征外,全局上下文信息也有助于有效地产生更准确、更平滑的分割结果。

  4. Attention Mechnism
    除了上下文信息外,注意力机制还强调了关系之间的建模,由于卷积是一块操作,很难建立所有像素之间的关系。然而对于一个被分类的像素,所有像素的重要性并不相等。注意力机制通过允许模型自动搜索域目标像素分类相关的像素,有效地捕获了长期依赖关系,如果能够对像素之间关系的重要性进行建模,则可以明显增强来自同一类对象的像素贡献,从而更好获得分割结果。在对对象内部像素进行分类时,更倾向于通过与目标像素属于同一个对象的内部像素来辅助分类。如DANet双重注意力机制,OCRNet捕获了对象的上下文表示,多尺度注意力机制,对每个像素位置的多尺度特征进行软加权。

  5. strong backbone
    ResNet与HRNet。
    ResNet成功实现了一个更深层次的网络,并将残差表示建模到CNN网络结构中,解决了训练一个非常深的网络结构的困难。
    HRNet通过并行连接高分辨率到低分辨率的卷积中,通过编码过程维护高分辨率表示。
    Paddleseg还用知识蒸馏,使骨干网络实现了更高的精度。

如果模型只有一两个策略,它可以作为实时分割应用的轻量级模型,GSCNN是一个具有边界和形状约束的新模型。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-08 22:28:33  更:2022-03-08 22:32:20 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 2:26:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码