| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> PAMI19 - 强大的级联RCNN架构《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》 -> 正文阅读 |
|
[人工智能]PAMI19 - 强大的级联RCNN架构《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》 |
原文https://arxiv.org/pdf/1906.09756 初识
本文主要解决的一个问题就是消除检测结果中的
由上图来看,那不是直接提升训练时的 显然,高质量的检测结果需要高质量的候选框,但这不能通过简单地提升训练时的阈值 而本文为了解决这个问题,提出了一种新的框架 Cascade RCNN可以很方便地应用在各类基于RCNN的模型中,并且得到较为显著的提升,除了检测之外,也可以很方便地应用到实例分割中,比如 相知Challenge to High Quality Detection作者这里再次提及到了高质量检测器【减少false positive】所面临的挑战:首先是分析了历史原因,之前的数据集对算法的检测性能要求比较宽松,在测试时只要预测框和 Cascade RCNN再次明确,
下图展示了不同阶段的候选框质量分布(横轴表示候选框与GT之间的iou),可以看到如果不使用Cascade架构,RPN输出的 Cascade R-CNN对于候选框和检测器质量的同步改进,使其能够解决 与相似工作的异同再回过头来看这张图,可以发现Cascade RCNN与( b )( c )两个工作存在一些相似之处,特别是( c ),只有检测头的区别,这里谈谈它们之间的异同。 图( c )展示了Intergral Loss的网络结构,其使用多分类器集成的方式:训练时构造不同的head进行分类任务,不同分类器采用不同的阈值 实验也表明,Cascade RCNN比这两种方法提升了不少: 扩展到实例分割Cascade RCNN架构很容易地就能扩展了实例分割任务中,用于Mask RCNN框架。
因此作者设计了( b )( c )( d )三种结构,值得注意的是,在测试时无论是哪种结构,都只采用最后一个阶段输出的检测框包含的ROI进行分割【在(d)结构中,会送入三个分支进行预测然后ensemble】。实验表明,三种设计的性能都优于Mask RCNN。 其他实验只放出这张与其他SOTA方法的比较,其他消融实验见原论文: 回顾Cascade RCNN这种策略其实在传统的机器学习与模式识别中就已经得到应用了,比如著名的VJ人脸检测器。但Cascade RCNN从实验现象开始挖掘,工作定位于“高质量的目标检测器”,通过实验分析,发现一些规律性的现象,因此采用级联的策略来解决的这个问题,不是单纯地套用结构。 这种级联的思想能够很容易地应用在各种two-stage工作中(RCNN系列),并且在各种数据集上也展现了提升。但这种策略并不一定适用于所有情况,比如在博主参加过的一个细胞实例分割的比赛中,发现应用cascade mask rcnn反而没有原始的mask rcnn好,个人猜测这是由于cascade rcnn本身是用于提升准确率的【降低false positive】,解决的是误检的问题,而细胞分割本身比较严重的问题是漏检,提升准确率的同时,必然会降低一部分召回率。大家在应用的时候,还是根据自己任务的实际情况为准,并进行调参,比如阈值 代码就不贴了,推荐大家使用 参考[1] https://neg5bl8b86.feishu.cn/docs/doccnny3gq2MZZJISDUYRivmcjb |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 21:22:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |