IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【2019-CVPR-3D人体姿态估计】Weakly-Supervised Discovery of Geometry-Aware Representation for 3D HPE.. -> 正文阅读

[人工智能]【2019-CVPR-3D人体姿态估计】Weakly-Supervised Discovery of Geometry-Aware Representation for 3D HPE..

Weakly-Supervised Discovery of Geometry-Aware Representation for 3D Human Pose Estimation

题目:《弱监督下的3D人体姿态估计的几何感知表示的发现》

作者

来源:CVPR 2019

研究内容:

????????单人-多视图-无监督

创新点:

????????①使用编码器-解码器网络的源视图与目标视图都为2D骨架

?????????(优 点:?准确保留人体姿态和几何形状;

????????????????????????将现有样本放一起训练并增加样本数量,以此尽可能有所有姿态的变化;

????????????????????????潜在空间G表示:只认为与2D姿态有关,不考虑外观、形状等)

????????②人体姿态的几何感知3D表示(geometry-aware 3D representation),并为提高潜在3D表示的鲁棒性,进一步引入表示一致性约束自编码器网络模型。

现有问题与技术

????????①将单视图估计出的3D HPE推广至不同环境的目标,对于现在实现还较为遥远;

????????②精确的3D注释需要大量精力且实践会受环境、外观等影响;

????????③在特定数据集中安装预定义的3D模型或多视图信息,难以捕获人体所有微妙姿势;

????????④与物体相比,人体是铰接且相比刚性对象更容易变形

本文框架:

??????在只有2D姿态标注的情况下,使用很少的3D数据进行训练,在潜在空间中找出3D姿态几何表示(G)

? ? ??弱监督:在多视图的2D关键点,使用自编码模型框架,作为监督。

本文主要分为以下3个框架:

???(1)图像骨骼映射组件(U-Net网络)

? ? ? 输入原始图像 ,此图像为不同视角i,j的同一人的同一时刻的图像,从预训练好的2D姿态估计器获得2D K个关节对的热图,构造2D骨架图,通过关节点的堆叠得到二值骨架对

? ? ? 同时,利用虚拟摄像机进行数据增强,采用随机采用二值骨架对进行训练,不用3D姿态作为标注,只使用2D骨架

(2)基于骨架的视图合成组件

????????根据(1)中得到的训练集T ={(Sit , Sjt , Ri→j )}N

????????●encoderφ的作用:将Si→Gi,即:将2D骨架图转化到隐式空间Gi,获得人体姿态几何表示;

????????●decoderψ的作用:在Ri→j的控制下,将Gi→Sj,即:将隐式空间转化到2D骨架图

????????????????????????????????????????Si 输入(源视图)已知视角的图像

????????????????????????????????????????????????????????????????↓同一对象

????????????????????????????????????????Sj 输出(目标视图)新视觉下的图像

????????引入重建损失函数

(3)表示一致性约束

????????当有遮挡时,单独两视图获得的几何表示G会有误差,此组件从单目图像的前两个组合中获得学习到的表示

??假设已知Ri→j且源视图与目标视图的映射为一对一

????????●encoder U的作用:将Sj→Gj,即:将目标骨架图转化到隐式空间G(~)j;

????????●decoder V的作用:在Ri→j的控制下,将Gi→Si,即:将几何表示G(~)j映射到源骨架。

?????(注:Gi, G(~)j是具有不同旋转系数的相机相对旋转矩阵;潜在空间G(~)j:几何感知的3D表示,可视为3D点云对其约束的线性插值)

? ? ? ? 使用双向自编码框架表示一致性损失

???????????????????????????????????????

(4)学习几何表示进行HPE

????????将单目视图输入(1)后,获得2D骨架表示,通过(2)中φ得到3D几何表示G,对G进行回归后得到相应的3D坐标B的线性函数。

数据集:

????????Human 3.6M;MPI-INF-3DHP;MPII Human Pose

??????? 评估:MPJPE;AUC;PCK

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-30 08:42:53  更:2022-04-30 08:46:18 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 8:48:21-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码