| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> ICCV2021 |重新思考人群中的计数和定位:一个纯粹基于点的框架 -> 正文阅读 |
|
[人工智能]ICCV2021 |重新思考人群中的计数和定位:一个纯粹基于点的框架 |
论文:Rethinking Counting and Localization in Crowds:A Purely Point-Based Framework 代码:https://github.com/TencentYoutuResearch/CrowdCounting-P2PNet 获取:在公众号CV技术指南中回复关键字“0007”可下载此论文 ?欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 前言: 在人群中定位个体更符合后续高级人群分析任务的实际需求,而不是简单地计数。然而,现有的基于定位的方法依赖于作为学习目标的中间表示(即密度图或伪框)是违反直觉和容易出错的。 论文提出了一个纯粹基于点的框架,用于联合人群计数和个体定位。对于这个框架,论文提出了一个新的度量标准,称为密度归一化平均精度?(density Normalized Average Precision --nAP),而不是仅仅报告图像级别的绝对计数误差,以提供更全面和更精确的性能评估。 此外,论文在这个框架下设计了一个直观的解决方案,称为点对点网络(P2PNet)。P2PNet 丢弃了多余的步骤,直接预测一组point proposals来表示图像中的头部,与人类标注结果一致。通过彻底的分析,论文揭示了实现这种新颖想法的关键步骤是为这些proposals分配最佳学习目标。 P2PNet 不仅在流行的计数基准上显着超越了SOTA方法,而且还实现了有前途的定位精度。 出发点
创新思路
MethodsPurely Point-based Framework这里简要说明这种新框架的思路。给定一个有N个个体的图像,用N个点来表示个体的头部中心点。网络输出两个东西,一个是预测头部的中心点P,一个是该中心点的置信度C。目标是使预测点与ground truth尽可能地接近,并有足够高的置信度。 与传统的计数方法相比,该框架提供的个体位置有助于那些基于运动的人群分析任务,如人群跟踪、活动识别、异常检测等?此外,该框架不依赖于劳动密集型标注、不准确的伪框或棘手的后处理,受益于原始点表示的高精度定位特性,特别是对于人群中高度拥挤的区域。 因此,这个新框架由于其相对于传统人群计数的优势和实用价值而值得更多关注。?然而,由于存在严重的遮挡、密度变化和标注错误,处理这样的任务是非常具有挑战性的?,这在?[13]?中甚至被认为是理想的但不可行的。 Density Normalized Average Precision一个预测点 p?j 只有在它可以匹配到某个ground truth pi 时才被归类为 TP。?匹配过程由基于像素级欧几里德距离的准则?(?pj , pi)?指导。?然而,直接使用像素距离来测量亲和度忽略了人群之间大密度变化的副作用。?因此,为此匹配标准引入了密度归一化,以缓解密度变化问题。 简单说来就是引入最近邻K(取3)个点,将它们的距离归一化。 用公式表示如下: 预测与ground truth匹配方案(a)?在为每个ground truth点选择最近的提议时,多个ground truth点可能与同一个提议匹配,这会导致计数低估。?(b)?在为每个提案选择最近的ground truth时,多个提案可能会与相同的地面实况点匹配,这会导致高估计数。?(c)?论文通过匈牙利算法进行一对一匹配没有以上两个缺陷,因此适合直接点预测。 ?P2PNetP2PNet?的整体架构 建立在 VGG16 之上,它首先引入了一个上采样路径来获得细粒度的深度特征图。?然后它利用两个分支同时预测一组点提议及其置信度分数。pipeline中的关键步骤是确保point proposals和ground truth点之间的一对一匹配,这决定了这些proposals的学习目标。 loss function如下: Conclusion?本文来源于公众号 CV技术指南 的论文分享系列。 ?欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 在公众号中回复关键字?“技术总结” 可获取以下文章的汇总pdf。 其它文章经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷 在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进? 知识蒸馏的简要概述? ? NMS总结? ? 注意力机制技术总结? ? 特征金字塔技术总结? ? 数据增强方法总结? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 20:22:34- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |