| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 游戏开发 -> 【Cascade FPD】《Deep Convolutional Network Cascade for Facial Point Detection》 -> 正文阅读 |
|
[游戏开发]【Cascade FPD】《Deep Convolutional Network Cascade for Facial Point Detection》 |
CVPR-2013 文章目录1 Background and Motivationface keypoint detection 有利于 face recognition and analysis face keypoint detection 难点在于 extreme poses, lightings, expressions, and occlusions 的场景 现有方法:
作者设计了一种级联的 CNN 结构——a cascaded regression approach for facial point detection with three levels of convolutional networks,significantly improves the prediction accuracy of SOTA and latest commercial software 2 Related Work
3 Advantages / Contributions
4 Method级联网络结构如下 五个关键点:
1)level 1 输入是整张脸,三个网络分别预测
三个网络的结果会平均一下作为后续 level 的输入的一部分 2)level2 和 level3 输入是以前一个 level 预测人脸关键点的坐标为基准的一个 patch level2 和 level3 有 10 个网络,分别预测 5 个关键点的横纵坐标 Predictions at the last two levels are strictly restricted because local appearance is sometimes ambiguous and unreliable. 3)最终预测
4)具体网络结构 level1 三个网络,level2 和 level3 各有 10 个网络,长啥样呢? 先看看 level1 的 F1
5)locally sharing weights globally sharing weights does not work well on images with fixed spatial layout, such as faces For example, while eyes and mouth may share low-level features (e.g. edges), they are very different at high-level. 先看看卷积的公式 简写成 C ( s , n , p , q ) C(s, n, p, q) C(s,n,p,q) C R ( s , n , p , q ) CR(s, n, p, q) CR(s,n,p,q) 则表示在 tanh 后加了个绝对值 除了 w w w 和 b b b 上多出来的 u u u 和 v v v 外和正常的卷积(没有 locally shared weight)一摸一样 输入特征图 ( h , w , m ) (h, w, m) (h,w,m)
把整图 ( h , w ) (h, w) (h,w) 大致分成了 p p p x q q q 块区域(用 u u u 和 v v v 来索引),每块区域大小大致为 Δ h \Delta h Δh x Δ w \Delta w Δw,每块区域内权重共享,而不是全图了(正常卷积全图内权重共享——kernel size 范围内当然不共享) 再看看池化层的公式 FC 层
tanh 函数 6)具体输入大小 可以看到 F1 的网络还在人脸的基础上外扩了一些 level2 和 level3 在 level1 输出的 point position 上外扩 5 Experiments5.1 Datasets
评价指标
误差大于 %5 则认为 failure l l l 为 bi-ocular distance(双目距离)更常见,but it has problem on faces with large pose variations, since bi-ocular distance of near-profile faces is much shorter than that of frontal faces,也即会放大侧脸时候的误差,上述的相对会好一些 5.2 Investigate network and cascade structures1)Network structure the performance can be significantly improved by including more layers S6 和 S7 的结构同 S0,但 S6 卷积用的 C 不是 CR,S7 用的是 globally shares weights 而不是 locally sharing weights We also find that locally sharing weights in higher layers is more important 2)Multi-level prediction 5.3 Comparison with other methods
6 Conclusion(own) / Future work代码:https://github.com/luoyetx/deep-landmark 推荐博客:
cascade locally sharing weights |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/16 22:00:47- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |