| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 图像分割概述及mask-rcnn简介 -> 正文阅读 |
|
[人工智能]图像分割概述及mask-rcnn简介 |
1 一些概念
?6 全景分割:语义+实例,更全面,全图所有像素目标,包括背景中的其他分类。 2 传统方法简介基于阈值 最简单/典型:二值化(阈值,自适应阈值,全局阈值等)?:前景/背景/物体之间不行。 ?基于区域
?值得一提:R-CNN目标检测第一阶段是通过Selective Search选择搜索框,这里借鉴类似上述区域生长过程。(根据颜色纹理等相似度不断合并不同区域) ?基于边缘检测 图像中的局部边缘信息,体现了灰度、颜色、纹理等图像特性的突变信息。一些边缘检测算法都可以实现,以sobel算子/canny算子为主要流行方法。 ? 其他:聚类,小波变换,模糊集理论等等。 3 深度学习的图像分割Minaee S , ?Y ?Boykov, ?Porikli F , et al. Image Segmentation Using Deep Learning: A Survey[J]. ?2020. ?下面简要介绍比较经典和较为有影响力的:FCN, U-Net, SegNet, mask-RCNN 其他一些比如PsP-Net, DeepLabV3也经常用来对比实验。 18~21年都有新的算法,各种各样的结构创新,离不开前面一些算法的影子。 FCN:Long J , ?Shelhamer E , ?Darrell T . Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39(4):640-651. 该网络试图从抽象的特征中恢复出每个像素所属的类别。即从图像级别的分类进一步延伸到像素级别的分类。(最早探索CNN+分割任务) ?全卷积?之前传统CNN是后面几个FC全连接,这里改为卷积比如1000*1*1 ?然后二维就可以计算卷积操作了。恢复尺寸?卷积到第五层,上采样32倍(反卷积),同时为了弥补pool中丢失的信息,第三四层再上采样8和16倍。来满足最后上采样至原来的图像尺寸,进而实现逐像素的语义分割。最后逐个像素计算softmax分类的损失, 相当于每一个像素对应一个训练样本。最后feature图的一个像素点值是一个样本? ?U-Net:Ronneberger O , ?Fischer P , ?Brox T . U-Net: Convolutional Networks for Biomedical Image Segmentation[J]. Springer International Publishing, 2015. 最开始用于生物医学图像分割:特征提取+上采样并各层concat连接前面特征。 ?--- > ?U-Net和FCN的区别: U-Net的第一个特点是完全对称,也就是左边和右边是很类似的,而FCN的decoder相对简单,只用了一个deconvolution的操作。第二个区别就是skip connection,FCN用的是加操作(summation,不同feature层),U-Net用的是叠操作(concatenation)。?U-Net有对称的encoder-decoder思想! SegNet:Badrinarayanan V , Kendall A , Cipolla R . SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017:1-1. 左边使用了VGG-16的前13层卷积网络,并做了少许的改动,用于提取特征并保存池化索引(目的是Decoder可以利用其来做非线性上采样。);右边是一个反卷积与upsampling的过程,通过反卷积使得图像分类后特征得以重现,upsampling还原到图像原始尺寸,该过程称为Decoder;最后使用Softmax输出不同分类的最大值,得到最终分割图。 4 DL分割之 mask-RCNNHe K , Gkioxari G , P Dollár, et al. Mask R-CNN[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017. ?faster RCNN阶段过程: ?因此,faster RCNN + 额外预测分割的像素mask(外加一段小FCN)! 注:ROIAlign代替ROIpooling (ROIpooling量化取整,新的方法允许小数坐标,其中的值通过双线性插值得到) ? 整体过程: FasterRcnn为每个候选对象ROI提供两个输出,一个类标签,一个边界框偏移量,为此,MaskRCNN并行添加了第三个分割mask的分支,mask分支是应用到每一个ROI上的一个小的FCN,以pix2pix的方式预测分割mask。 ?5 mask-rcnn一些复现效果复现coco数据集分割 (预训练模型下再迭代训练3次效果)
?一些指标意思: -------------------- 某一张图模型推理结果剖析 -------------------------------result[0]: 目标检测结果, result[0][0] ~ result[0][79] result[1]: 目标分割结果, result[1][0]~result[1][79] 目标检测结果中,每一个类是m*5的数据,m为目标数,5个分别是[w1,h1,w2,h2,prob] 目标分割结果中,每一个类是m*[W,H],m为目标数,WH是原图尺寸大小。[W,H中,如果为前景则为True值,如果为背景,则为Fasle值。 最终,mmdet的show_result,综合上述所有结果画出如下结果: ?分割单独画出效果: ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 16:55:35- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |