IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Realtime Performance-Based Facial Animation 论文阅读 -> 正文阅读

[人工智能]Realtime Performance-Based Facial Animation 论文阅读

中心思想: 创建一个仅使用Kinect设备的实时人脸驱动的系统

备注:这是一个伪实时,因为personal bsoffline 创建的

文章的主要流程如上图

  1. ? Kinect获取RGB+depth图片
  2. ? 使用offline获取的bs和先验概率去监督生成bs系数,为了时序更稳定加入了时域一致性监督
  3. ? 获得系数之后,使用系数驱动其它数字人

文章难点:

? 难点1: personal bs 制作

? 难点2: BS系数的先验分布和时域监督

? 难点3:系数的优化

难点1: personal bs 制作

  1. ? 首先固定被采集的表情
  2. ? 使用Kinect采集只有head pose运动,表情不动的人头数据,使用去躁方法生成accumulated scans
  3. ? 使用bfm99 fit 中性scan 得到neutral face mesh作为模板(T)
  4. ? 根据采集的不同表情,使用 non-rigid icp T变形为相同拓扑的不同表情mesh
  5. ? 使用example based facial rigging方法,输入上述带表情的mesh 和 一套确定的blendshapes,生成这个人特有的一组blendshapes

备注:

  1. Blendshapes 就是 在中性无表情mesh的基础上产生不同单个表情的变化而生成的一组用来表达表情的meshes
  2. 原则是这些单个表情的组合应该能够表达出人脸所有面部肌肉的运动

难点2:? 先验制作和时域监督 (这部分数学模型太多,没看懂)

  1. ? 设置一个滑动窗
  2. ? 在滑动窗内,在已知前面系数的概率分布同时,结合当前帧的depthtexture信息计算当前帧的结果

难点3: 系数优化

系数优化总共三个部件

  1. ? 几何监督;可以理解为mesh点和depth点云的loss监督
  2. ? 图像监督;可以理解为,在得到personal bs的同时,还有对应的纹理,在获取当前帧人脸的pose后,可以将人脸投影到图像上,获取像素值的loss
  3. ? 先验监督;就是根据滑动窗内前几帧的结果获取当前帧的分布符合整体分布

备注:

  1. 图像监督没有代码操作过
  2. 先验监督,只使用过pca基的奇异值进行监督

我不会的点

  1. ? 多帧depth生成accumulated 3d model;感觉类似kinect fusion
  2. ? 泊松融合 ; opencv操作是有的可以参考下一页
  3. ? Non-rigid ICP 没有实际进行操作过,后续会更新
  4. ? exampled based facial rigging后续会更新
  5. ? loss中加入image监督;后续会更新
  6. ? 时域loss 滑动窗口滤波;后续会更新

part2---泊松融合

  1. 自己理解(一句话解释泊松融合):
  2. 将前景图融入背景图中,并保持前景图内容平滑(和背景图片梯度一致/和前景与背景的组合结果梯度一致)和背景图的边界处一致

上图中变量:

  1. V是背景图g的梯度(已知)
  2. omiga是背景图上的融合区域
  3. omiga导数是背景图边界
  4. f是融合后mask内像素的表征
  5. f*是融合后mask外像素表征

参考论文/链接

[1] Weise, Thibaut, et al. "Realtime performance-based facial animation."?ACM transactions on graphics (TOG)?30.4 (2011): 1-10.?

[2]?Poisson Image Editing

[3]?从泊松方程的解法,聊到泊松图像融合 - 知乎

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-26 08:51:52  更:2021-11-26 08:54:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 3:46:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码