3D人体姿态估计项目 | 从2D视频中通过检测人体关键点来估计3D人体姿态实现

  • 项目应用场景
    • 人体姿态估计是关于图像或视频中人体关节的 2D 或 3D 定位。一般来说,这个过程可以分为两个部分:(1) 2D 视频中的 2D 关键点检测;(2) 根据 2D 关键点进行 3D 位姿估计。这个项目使用 Detectron2 从任意的 2D 视频中检测 2D 关节关键点,然后使用预训练模型从 2D 关键点预测 3D 关节关键点。
  • 项目效果
  • 项目流程

(1) 下载 2D detectron2 模型

bash 复制代码
 cd detectron2/detectron2-infer
 wget https://dl.fbaipublicfiles.com/detectron2/COCO-Keypoints/keypoint_rcnn_X_101_32x8d_FPN_3x/139686956/model_final_5ad38f.pkl

(2) 下载 3D 模型

bash 复制代码
 # in the root directory, make a folder called checkpoint 
 mkdir checkpoint
 cd checkpoint
 wget https://dl.fbaipublicfiles.com/video-pose-3d/pretrained_h36m_detectron_coco.bin

(3) 估计 2D 视频,把视频放置到文件夹 detectron2/detectron2-infer/videos

bash 复制代码
  cd detectron2/detectron2-infer

  sh infer.sh videos/[your-video-name] [output-video-name-you-want]

  # 结果输出在`output`文件夹
相关推荐
转转技术团队2 小时前
没有测试的核心代码,怎么交给 AI 重构
人工智能
爱读源码的大都督3 小时前
Claude Code源码分析(三):为什么系统提示词中需要有tools呢?
前端·人工智能·后端
半个落月4 小时前
LLM如何预测下一个Token?一文拆解Transformer核心流程
人工智能
触底反弹4 小时前
🔥 2026 年爆火的 Harness Engineering 到底是什么?从原理到实战一文讲透
javascript·人工智能·程序员
user4465117917914 小时前
源码深读 XAgent:6 个 Agent 怎么分工?工具失败不崩、死循环怎么防?
人工智能
魏祖潇4 小时前
SDD 完整指南——Spec 端打底、Story 端交付、留白区
人工智能·后端
常丛丛4 小时前
5.9 式输出:实时查看 LangGraph Agent 思考过程
人工智能
Token炼金师4 小时前
从节点图到低秩矩阵:ComfyUI 推理引擎与 LoRA 适配机制拆解
人工智能·aigc
武子康4 小时前
调查研究-210 Netflix 用 AI 复刻 Gene Wilder 的声音:语音克隆的下半场,不是模型,而是权利
人工智能·aigc·openai