| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 语义分割模型之DeepLab系列 -> 正文阅读 |
|
[人工智能]语义分割模型之DeepLab系列 |
语义分割模型之DeepLab系列
前言DeepLab系列一共有四篇文章,分别对应DeepLab V1、DeepLab V2、DeepLab V3和DeepLab V3+。 DeepLab V1论文题目:Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs DeepLab V2论文题目:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs DeepLab V3论文题目:Rethinking Atrous Convolution for Semantic Image Segmentation DeepLab V3+论文题目:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLab系列的思想图像分割CNN是根据classification这种high-level semantics改编的,但CNN做语义分割时精准度不够,根本原因是 DCNNs 的高级特征的平移不变性,即高层次特征映射,根源于重复的池化和下采样会丢失localization信息,即无法对像素点精确定位语义(low-level semantics)。 针对下采样或池化降低分辨率,DeepLab采用了空洞卷积代替池化操作来扩展感受野,获取更多的上下文信息。同时DeepLab v1v2 结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。DeepLab v2提出了串行的ASPP模块,ASPP增强了网络在多尺度下多类别分割时的鲁棒性, 使用不同的采样比例与感受野提取输入特征,能在多个尺度上捕获目标与上下文信息,虽然大大扩展了卷积核的感受野,但随着感受野越来越接近图像大小,会退化为1x1卷积。 为了解决这个问题,DeepLab v3改进了ASPP空洞卷积空间金字塔池化层,不同的dilation卷积并行操作,然后归一尺寸后求和。ASPP模块借鉴PSPNet思想,通过不同采样率的空洞卷积并行采样,捕捉图像不同尺度的上下文信息。 DeepLab v3+通过添加一个简单而有效的解码器模块扩展DeepLab v3以优化分割结果,在PASCAL VOC 2012数据集和Cityscapes数据集中分别取得了89%和82.1%的MIOU。 语义分割面临的主要挑战分辨率 多尺度特征 1 DeepLab V1DeepLab v1是结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法 深度卷积神经网络(DCNNs) 概率图模型(DenseCRFs) DeepLab v1:VGG16+空洞卷积+CRF对边缘分割结果进行后处理。针对下采样或池化降低分辨率,DeepLab采用了空洞卷积来扩展感受野,获取更多的上下文信息。同时,采用完全连接的条件随机场(CRF)提高模型捕获细节的能力。 感受域和步长以及卷积核之间的对应关系: DeepLab v1 的网络结构1.把全连接层(fc6、fc7、fc8)改成卷积层(端到端训练) 实验设置网络变形: 2 DeepLab V2
背景知识空洞卷积(Atrous Convolution)稠密映射: ResNet变化率:残差的引入去掉了主体部分,从而突出了微小的变化。 主要思想:用一个神经网络去拟合y=x这样的恒等映射,比用一个神经网络去拟合y=0这样的0映射要难。因为拟合y=0的时候,只需要将权重和偏置都逼近0就可以了。 Network&ASPPASPP模块构成——>DeepLab v1到DeepLab v2的进化——>基于VGG16的DeepLab v2在v1的基础上做了进一步调整(FC6-FC8替换为ASPP)
实验设置损失函数:交叉熵 + softmax 3 DeepLab V3
语义分割常用特征提取框架 网络结构经典分类算法网络架构,如ResNet ——> DeepLab v3空洞卷积串行网络结构 ——> DeepLab v3空洞卷积并行网络结构(调整了ASPP模块) 实验设置**裁剪尺寸:**裁剪图片至513x513(为了更好的拟合空洞率) BN层策略:当output_stride=16时,batchsize=16,同时BN层做参数衰减decay=0.9997。在增强的数据集上,以初始学习率0.007训练30K后,冻结BN层参数。当output_stride=8时,batchsize=8,使用初始学习率0.001训练30K。 4 DeepLab V3+
背景知识深度可分离卷积标准卷积: 深度可分离卷积是组卷积的一种极端情况,也就是输入有多少个通道,对应的分组就有多少个组,即分组的组数=输入特征图的通道数。 **深度卷积:**每个5×5×1的卷积核对应输入图像中的一个通道,得到三个8×8×1的输出, 拼接后得到8×8×3的结果 **逐点卷积:**设置256个1×1×3的卷积核,对深度卷积的输出再进行卷积操作,最终得到 参数计算: 网络结构编码器:
解码器:
实验设置剪尺寸:裁剪图片至513*513 论文总结DeepLab系列发展历程 v1:修改经典分类网络(VGG16),将空洞卷积应用于模型中,试图解决分辨率过低及提取多尺度特征问题,用CRF做后处理(VGG16+空洞卷积+CRF对边缘分割结果进行后处理) v2:设计ASPP模块,将空洞卷积的性能发挥到最大,沿用VGG16作为主网络,尝试使用ResNet-101进行对比实验,用CRF做后处理(VGG16/ResNet+串行的ASPP模块+CRF对边缘分割结果进行后处理) v3:以ResNet为主网络,设计了一种串行和一种并行的DCNN网络,微调ASPP模块,取消CRF做后处理(ResNet+改进后的并行ASPP模块) v3+:以ResNet或Xception为主网络,结合编解码结构设计了一种新的算法模型,以v3作为编码器结构,另行设计了解码器结构,取消CRF做后处理(ResNet/Xception+并行的ASPP模块+编码器结构) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 21:31:31- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |