3D人体姿态估计项目 | 从2D视频中通过检测人体关键点来估计3D人体姿态实现

  • 项目应用场景
    • 人体姿态估计是关于图像或视频中人体关节的 2D 或 3D 定位。一般来说,这个过程可以分为两个部分:(1) 2D 视频中的 2D 关键点检测;(2) 根据 2D 关键点进行 3D 位姿估计。这个项目使用 Detectron2 从任意的 2D 视频中检测 2D 关节关键点,然后使用预训练模型从 2D 关键点预测 3D 关节关键点。
  • 项目效果
  • 项目流程

(1) 下载 2D detectron2 模型

bash 复制代码
 cd detectron2/detectron2-infer
 wget https://dl.fbaipublicfiles.com/detectron2/COCO-Keypoints/keypoint_rcnn_X_101_32x8d_FPN_3x/139686956/model_final_5ad38f.pkl

(2) 下载 3D 模型

bash 复制代码
 # in the root directory, make a folder called checkpoint 
 mkdir checkpoint
 cd checkpoint
 wget https://dl.fbaipublicfiles.com/video-pose-3d/pretrained_h36m_detectron_coco.bin

(3) 估计 2D 视频,把视频放置到文件夹 detectron2/detectron2-infer/videos

bash 复制代码
  cd detectron2/detectron2-infer

  sh infer.sh videos/[your-video-name] [output-video-name-you-want]

  # 结果输出在`output`文件夹
相关推荐
We་ct1 小时前
LeetCode 5. 最长回文子串:DP + 中心扩展
前端·javascript·算法·leetcode·typescript
一点一木3 小时前
🚀 2026 年 4 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
淡海水4 小时前
【AI模型】常见问题与解决方案
人工智能·深度学习·机器学习
HIT_Weston5 小时前
65、【Agent】【OpenCode】用户对话提示词(费米估算)
人工智能·agent·opencode
njsgcs5 小时前
我的知识是以图片保存的,我的任务状态可能也与图片有关,我把100张知识图片丢给vlm实时分析吗
人工智能
星爷AG I5 小时前
20-4 长时工作记忆(AGI基础理论)
人工智能·agi
王老师青少年编程5 小时前
csp信奥赛C++高频考点专项训练之贪心算法 --【哈夫曼贪心】:合并果子
c++·算法·贪心·csp·信奥赛·哈夫曼贪心·合并果子
#卢松松#5 小时前
用秒悟(meoo)制作了一个GEO查询小工具。
人工智能·创业创新
zandy10115 小时前
Agentic BI 架构实战:当AI Agent接管数据建模、指标计算与可视化全链路
人工智能·架构
数字供应链安全产品选型5 小时前
关键领域清单+SBOM:834号令下软件供应链的“精准治理“逻辑与技术落地路径
人工智能·安全