CVPR2023新作:3D人体姿态估计

  1. Title: 3D Human Pose Estimation via Intuitive Physics

  2. Affiliation: Max Planck Institute for Intelligent Systems, Tübingen, Germany

  3. Authors: Shashank Tripathi, Lea Müller, Chun-Hao P. Huang, Omid Taheri, Michael J. Black, Dimitrios Tzionas

  4. Keywords: 3D human pose estimation, physics engine, intuitive-physics terms, pressure heatmap, stable configuration.

  5. Summary:

  • (1): 本文的研究背景是3D人体姿态的估计。

  • (2): 过去的方法忽略了人体与场景的交互,导致估计到的结果往往不够精准、不符合物理规律。本文提出了IPMAN,这一方法具有可解释性、易于实现、计算速度快、可由基于优化和回归的现有方法轻松调用等特点。

  • (3): 本文提出了一种直观物理学(IP)的思想,从3D SMPL Body与场景的交互中推断出身体上的压力热图、压力中心和SMPL Body的重心。并且根据这些信息,用IPMAN估计出色彩图像中的3D人体姿态,从而实现姿态在物理上的"稳定"。 本文的方法是通过于SMPL Body的物理学、以及把压力热图、压力中心、SMPL Body的重心考虑进去,这一具有鲜明特色的方法实现的。

  • (4): 本文在多个数据集上验证了IPMAN的性能,结果显示IPMAN的表现优于目前最先进的方法,并且在提高静态姿势准确率的同时也不会损害动态姿势的准确性。文章提供了IPMAN源代码和数据,同时发表在了CVPR会议上。

  1. Methods:
  • (1): 本文提出的方法是利用直观物理学(IP)的思想,从3D SMPL Body与场景的交互中推断出身体上的压力热图、压力中心和SMPL Body的重心。通过与SMPL Body的物理学、以及考虑压力热图、压力中心、SMPL Body的重心,得出一个具有鲜明特色的3D人体姿态估计方法IPMAN。

  • (2): 在IPMAN中,压力热图用于表示3D SMPL Body与场景之间的接触,压力中心表示场景施加的力影响着身体的哪些部位,而SMPL Body的重心(通过计算所有顶点的加权平均)有助于保持姿势的稳定性。

  • (3): IPMAN方法在预测3D人体姿态时,先利用现有的2D关键点检测器检测得到2D关键点,并根据这些关键点构建输入坐标图,这个输入坐标图可以被用于预测3D人体姿态。根据陆续输入的样本,模型可以自适应地学习更好的姿态估计。

  • (4): 为了证明IPMAN的优越性,本文的作者在几个数据集上进行了实验,结果显示IPMAN比现有方法更好地估计了3D人体姿态。注意到我们的方法不仅提高了静态姿势估计的准确性,而且在动态情况下同样有效。

  1. Conclusion:
  • (1): 本文提出了一种利用直观物理学来估计3D人体姿态的方法,能够更好地推断出身体的稳定姿态,提高静态姿态准确率的同时不会影响动态姿态的准确性。这项工作对于人体活动分析、运动医学和虚拟现实等领域具有重要意义。

  • (2): 创新点:本文利用直观物理学的思想,设计了一种新的3D人体姿态估计方法,通过压力热图、压力中心和SMPL Body的重心来推断身体的稳定姿态;

性能:本文的实验结果表明所提出的IPMAN方法在多个数据集上比现有方法表现更优,不仅提高了姿态准确性,还保持了计算速度快的特点;

工作量:文章提供了IPMAN方法的源代码和数据集,可以方便地应用于现有的优化和回归方法,具有易于实现的特点。

相关推荐
金融小师妹44 分钟前
基于多源政策信号解析与量化因子的“12月降息预期降温”重构及黄金敏感性分析
人工智能·深度学习·1024程序员节
nnn__nnn1 小时前
图像分割技术全解析:从传统算法到深度学习的视觉分割革命
深度学习·算法·计算机视觉
盼小辉丶1 小时前
PyTorch实战(10)——从零开始实现GPT模型
人工智能·pytorch·gpt·深度学习
Blossom.1182 小时前
大模型量化压缩实战:从FP16到INT4的生产级精度保持之路
开发语言·人工智能·python·深度学习·神经网络·目标检测·机器学习
Stara05112 小时前
DeepSeek-OCR私有化部署—从零构建OCR服务环境
计算机视觉·docker·ocr·transformers·vllm·deepseek·光学符号识别
Ro Jace2 小时前
三国华容道(横刀立马)移动策略
android·java·数据库·人工智能·深度学习·神经网络·游戏
wanzhong23333 小时前
CUDA学习2-CPU和GPU的性能优化
深度学习·gpu·cuda·高性能计算
晨非辰3 小时前
【数据结构】排序详解:从快速排序分区逻辑,到携手冒泡排序的算法效率深度评测
运维·数据结构·c++·人工智能·后端·深度学习·排序算法
能来帮帮蒟蒻吗3 小时前
深度学习(4)—— Pytorch快速上手!从零搭建神经网络
人工智能·pytorch·深度学习
Blossom.1183 小时前
大模型知识蒸馏实战:从Qwen-72B到Qwen-7B的压缩艺术
大数据·人工智能·python·深度学习·算法·机器学习·pygame