| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> [小样本图像分割]SG-One: Similarity Guidance Network for One-Shot Semantic Segmentation -> 正文阅读 |
|
[人工智能][小样本图像分割]SG-One: Similarity Guidance Network for One-Shot Semantic Segmentation |
论文地址:SG-One: Similarity Guidance Network for Abstract
INTRODUCTION目前的网络都是基于孪生框架,简单地说,训练一对并行网络,分别提取标记支持图像和查询图像的特征。然后融合这些特征,生成目标对象的概率图。网络的目的实际上是在高层特征空间中学习带密集标注的支持图像和查询图像之间的关系。
为了克服上述方法的缺点, 本文提出了一种用于一次性语义切分的相似性引导网络(SG-one)。SG One的基本思想是通过有效地结合支持对象和查询图像特征之间的像素相似性来指导分割过程。特别地,我们首先提取输入的支撑集图像和查询图像的高级特征映射。高级特征(High-level features)通常是抽象的,且属于同一类别对象的像素的嵌入在高级特征中非常接近。 背景像素的嵌入通常被抑制,并且这些嵌入表达与前景对象的嵌入表达距离较远。因此,我们提出了一种掩码平均池化方法来从支持图像中获取表达向量。掩码平均池化可以通过排除背景噪声的影响,提取出与对象相关的特征。然后,我们通过计算每个支持图像表达向量和查询图像在每个像素上的余弦相似度来得到引导映射。如果查询图像中对象像素对应的特征向量与支持图像中提出的表达向量接近,那么引导映射的对应得分较高。否则,如果像素属于背景,引导映射的分数就会很低。所生成的引导图被用于向分割过程提供所需区域的引导信息。具体的说,就是查询图像的位置特征向量乘以相应的相似度值。该策略在支持图像及其掩码的引导下,能够有效激活查询图像的目标对象区域。 与之前的技术相比,我们的方法提供了多种吸引人的优势,例如OSLSM【15】和co FCN【16】。
SG One的概述如上图所示。我们应用两个分支,即 总而言之,我们的主要贡献有三个方面:
RELA TED WORKOSS旨在对给定图像中的每个像素进行分类,以区分不同的对象或内容。以密集注释作为监管的OSS在精确识别各种对象方面取得了巨大成功【18】–【25】。近年来,大多数性能优异的工作都是基于深度卷积网络的。FCN[2]和U-Net[1]放弃了完全连接的层,建议仅使用卷积层来保持像素的相对位置。基于FCN的优点,Chen等人[26],[27]提出的DeepLab是分割的最佳算法之一。与大卷积核方法相比,它采用扩展卷积运算(dilated convolution operations)来增加感受野,同时节省参数。He等人[3]提出的分割掩码和检测边界框可以使用统一网络同时预测。 METHODOLOGYProposed Model支持图像和掩码对(pairs)通常被编码为代表向量。OSLSM建议通过增加二进制掩码来支持图像,从而从支持图像中删除背景像素。co-FCN提出将支持图像与正负掩码连接,构建五个通道的输入块。然而,这两种方法都有两个缺点。首先,将背景像素擦除为零将改变支持图像集的统计分布。如果使用统一的网络对查询图像和擦除后的支持图像进行处理,输入数据的方差将大大增加。其次,将支持图像与其掩码拼接在一起,破坏了网络的输入结构,也会阻碍统一网络的实现。 平均掩码池化代码解读将输出的支撑集图片特征outA_pos上采样到和mask一个大小,之后相乘求和得到原型向量
相似性引导代码解读
接着
至此,前向传播完毕。 损失计算反向传播主函数中:
上采样计算损失函数:
vgg16_sg参考:PyTorch之VGG16网络结构详解以及源码解读 SG-One主要包含三个部分,即1)stem;2)相似性指导;3)分割分支。stem其实就是个用来提取特征的全卷积网络(ResNet,VGG啥的)。将提取的查询图像和支持图像的特征输入相似指导分支。我们将参考对象的特征与查询图像的特征相结合,利用该分支生成相似引导图。对于支持图像的特征,我们实现了三个卷积块来提取高度抽象和语义的特征,然后是一个掩码平均池化来获取代表向量。提取的支持图像的代表向量应包含特定对象的高级语义特征。对于查询图像的特征,我们重用这三个块,并利用余弦相似层计算查询图像的每个像素处的代表向量和特征之间的相似度。分割分支用于在生成的相似图的指导下发现查询图像的目标对象区域。 CONCLUSION我们提出SG-One可以在仅使用一个标注的样本情况下有效地分割新类别的语义像素。我们提出了掩码平均池化的方法来提取更健壮的对象相关的代表性特征。大量的实验表明,掩蔽平均池化方法更方便,能够结合上下文信息来学习更好的代表性向量。我们通过使用一个统一的网络来减少模型参数以降低过拟合的风险。我们所提出的网络同样可以直接应用于多分类图像的分割。我们提出了一个纯端到端网络,它不需要任何预处理或后处理步骤。更重要的是,SG-One提高了One-Shot语义分割的性能,超越了基准方法。最后,我们分析了一次性视频分割和我们的一次性图像语义分割问题之间的关系。实验表明,在公平的比较条件下,所提出的SG-One算法在视频对象分割方面具有优越性。与此形成鲜明对比的是,一个One-Shot图像分割任务提供的图像的目标对象或背景并不连续。查询图像中的对象和背景与支持图像存在较大差异。例如,在我们的One-Shot图像分割任务中,我们可能需要分割一个站在草地上的老人和一个躺在床上的小女孩,因为他们都属于同一类别,即是一个人。其次,得益于视频中的序列线索,视频分割方法可以从连续的帧中计算出帧间的相似度,并通过在线更新提高性能。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 5:37:41- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |