[人工智能] Fully Convolutional Networks for Semantic Segmentation

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Fully Convolutional Networks for Semantic Segmentation -> 正文阅读

[人工智能]Fully Convolutional Networks for Semantic Segmentation

fcn提出了一个新颖的架构，目前来看，这也几乎是目前所有的语义分割问题的架构，encoder-decoder架构。

1.introduction

????????from coarse to fine inference is to make a prediction at every pixel,从粗推理到精细推理的下一步是对每个像素进行预测。

Semantic segmentation faces an inherent tension between?semantics and location: global information resolves?what while local information resolves where. 语义分割面临语义和位置的内在张力：全局信息在解决什么，局部信息在解决什么，深度特征层次在local-to-global金字塔上联合编码位置和语义信息。我们定义了一种新颖的skip结构来联合deep，coarse，semantic信息和shallow，fine，appearance信息。

2.fully convolutional networks

????????Locations in higher layers correspond to the locations?in the image they are path-connected to, which are called?their receptive fields.较高层中的位置对应于他们路径连接到图像中的位置，成为他们的感受野。convnets建立在平移不变性上，它们的基本组件（卷积、池化和激活函数）在局部输入区域上运行，并且仅依赖于相对空间坐标。

2.1 adapting classifiers for dense prediction

????????全连接层具有固定的维度并丢弃了空间坐标，让位置信息消失了，只保留语义信息，因此将全连接操作更换为卷积操作可以同时保留位置信息及语义信息，达到给每个像素分类的目的。这些全连接层也可以视为具有覆盖其整个输入区域内核的卷积，这样做会将他们转换为完全卷积的网络，该网络接受任何大小的输入和输出分类图。用fc产生最后一层输出和cnn是等效的，但是cnn要快的多。全卷积的输出是相对输入大小减少一个因子，该因子等于输出单元的感受野的像素步长。