| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 姿态估计之CPN(Cascaded Pyramid Network for Multi-Person Pose Estimation) -> 正文阅读 |
|
[人工智能]姿态估计之CPN(Cascaded Pyramid Network for Multi-Person Pose Estimation) |
该论文发表在2018年CVPR上,用于多人姿态估计的级联金字塔网络 arxiv论文地址:https://arxiv.org/abs/1711.07319 github代码:https://github.com/GengDavid/pytorch-cpn,https://github.com/chenyilun95/tf-cpn 文档编辑参考: 1、论文笔记(CPN):Cascaded Pyramid Network for Multi-Person Pose Estimation 2、2018-CPN:Cascaded Pyramid Network for Multi-Person Pose Estimation - 知乎 一、背景目前多人姿态估计中仍然存在的问题(hard” keypoints)(遮挡点,不可见点和拥挤的背景,是的人体关键点检测存在的问题),其原因归纳为两点: 1)只通过表层特征不能识别这些“难点”,例如:躯干点; 2)在训练过程中没有明确解决这些“难点”的检测问题; 因此,作者提出了一种新的网络结构,称为Cascaded Pyramid Network(CPN)级联金字塔网络,该网络可以有效缓解“hard” keypoints的检测问题,CPN网络分为两个阶段:GlobalNet和RefineNet。GlobalNet网络是一个特征金字塔网络,该网络用于定位简单的关键点,如眼睛和手等,但是对于遮挡点和不可见的点可能缺乏精确的定位;RefinNet网络该网络通过集合来自GolbalNet网络的多级别特征来明确解决“难点”的检测问题。 三大创新点:
采用了top-down的路线:先在image上使用一个human detector得到人的bounding-boxes,然后再使用cpn网络进行关键点的检测;重点在cpn网络实现的关键点检测。 二、 Human Detector类似于 Mask R-CNN,CPN pipeline 也是自顶而下的:首先通过人体检测器根据图像生成一个边界框集合bounding-boxes;然后使用bounding-boxes对原图进行裁剪,并将裁剪后的结果用于CPN网络,接着通过单人关键点估计器预测每个人关键点的详细定位。采用基于 FPN 的当前最优物体检测器作为人体检测器,并用 Mask R-CNN ROIAlign 替代 FPN ROIPooling。 2.1 FPN目标检测算法FPN(Feature Pyramid Networks)简介 FPN使用不同分辨率的特征图感知不同大小的物体,并通过连续上采样和跨层融合机制使输出特征兼具底层视觉信息和高层语义信息。低层次的特征图语义不够丰富,不能直接用于分类,而深层的特征更值得信赖。将侧向连接与自上而下的连接组合起来,就可以得到不同分辨率的特征图,而它们都包含了原来最深层特征图的语义信息。 ?2.2 Mask R-CNN 回顾R-CNN ? Fast R-CNN Faster R-CNN 实现了与特征提取器网络共享卷积层的区域提案网络(RPN) Mask R-CNN = Backbone+RPN+RoIAlign+(分类+回归+mask) RoIAlign与RoIPooling参见 RoIPooling、RoIAlign笔记 ? RoIPooling量化取整为最大值。 RoiAlign量化不取整,保持浮点数。 ? ? ? 上图中,四个红色叉叉‘×’的像素值是通过双线性插值算法计算得到的 三、 cascaded Pyramid Network(CPN)
3.1? GolbalNet
?在GlobalNet中,得到了四层特征图,作者通过给每一层特征图设计了不同的数量的botleneck块,再分别经过不同倍率的上采样,然后经过concat操作后,达到了对不同尺度特征的结合,最后经过一个bottlenet块,再经过简单的变换,得到网络的最终的输出。 3.2 RefineNet
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/1 23:38:46- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |