IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【2020-CVPR-3D人体姿态估计】Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis -> 正文阅读

[人工智能]【2020-CVPR-3D人体姿态估计】Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis

Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis

题目:《通过部分指定新型图像合成进行自监督的3D人体姿态估计》

作者Jogendra Nath Kundu Siddharth Seth1 arun Jampani2 Mugalodi Rakesh1 R. V enkatesh Babu1 Anirban Chakraborty

Indian Institute of Science, Bangalore 2Google Research

来源:CVPR 2020

研究方向:单目/多视角(后期提出)-单人姿态识别

已有研究困境:

? ? ? 现有研究多为在有监督情况下,对GT姿势注释的常用方法是经过良好校准的多摄像头,难以在室外进行配置,导致3D姿态数据集的多样性受限

改进:

? ? ?自监督学习框架:将消除(如姿态和外观)的变换,与未标记的视频帧区分开,可以在大规模野外视频中学习视频。

研究方法(思路)

整体结构:

全卷积解码器体系输入?? ?姿态条件?? ? ?使用单个模型模板编码2D关节和零件部位关联

编码器网络:

输入图像得出①标准坐标系中视图不变的3D姿态

? ? ? ? ? ? ? ? ? ? ?②FG(前景)人体外观

? ? ? ? ? ? ? ? ? ? ?③摄像机参数

通过①③对零件遮挡建模实现零件分割;①对3D刚性(全局)和非刚性(部分)建模

解码器网络:

将上述结果投影至2D上(生成局部3D矢量,根据3D姿态节约约束条件一系列变换),合并成FG人体外观+2D部分分割

实现细节:

①关节锚定的空间零件表示过程:

? ? ? ?先使用带监督的锚框提取2D姿态关键部位

? ? ?(从单个手动注释的模板中提取2D关节相对对身体部位关联,从而可以变换任何人的pose+保持完整的锚定关节关联)

②对零件部件的规范:对2D pose零件部分进行高斯模糊处理

? ? ? ? ? ? ? ? ? ? ? ? 👇提取2D pose

? ? 零件变形模型:标准部位图(零件图),进行旋转、平移、缩放,局部姿态图

? ? ? ? ? ? ? ? ? ? ? ? ?👇由①2D骨架姿态②零件形状信息③零件空间遮挡知识得出2D零件分割

? ?过程:通过访问相应的3D姿态表示相机转换:提取①③,可以深度感知零件并细分,了解局部pose强度

? ? ? ? ? ? ? ? ? ? ? ? ?👇自监督的姿态网络

? 分为:

? ? ? ? 编码器网络:定义规范坐标系,递归正向运动学变换,局部肢体矢量

? ? ? ? 输出:摄像机的外部特性C(3个旋转+3个受限平移),固定透视摄像机投影用于获得最终2D姿态

? ? ? ?解码器网络:输入FG人体外观+2D姿态变形后

? ? ? ?输出:重构图像(完全不同BG的图像对)+预测零件分割图

③自监督训练目标:形成具有一致pose(用于姿态和外观信息)的成对输入图像

数据集:对于LSP数据集、YouTube视频和本论文自采集数据

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-06 23:10:15  更:2022-04-06 23:10:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:27:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码