3D人体姿态估计项目 | 从2D视频中通过检测人体关键点来估计3D人体姿态实现

  • 项目应用场景
    • 人体姿态估计是关于图像或视频中人体关节的 2D 或 3D 定位。一般来说,这个过程可以分为两个部分:(1) 2D 视频中的 2D 关键点检测;(2) 根据 2D 关键点进行 3D 位姿估计。这个项目使用 Detectron2 从任意的 2D 视频中检测 2D 关节关键点,然后使用预训练模型从 2D 关键点预测 3D 关节关键点。
  • 项目效果
  • 项目流程

(1) 下载 2D detectron2 模型

bash 复制代码
 cd detectron2/detectron2-infer
 wget https://dl.fbaipublicfiles.com/detectron2/COCO-Keypoints/keypoint_rcnn_X_101_32x8d_FPN_3x/139686956/model_final_5ad38f.pkl

(2) 下载 3D 模型

bash 复制代码
 # in the root directory, make a folder called checkpoint 
 mkdir checkpoint
 cd checkpoint
 wget https://dl.fbaipublicfiles.com/video-pose-3d/pretrained_h36m_detectron_coco.bin

(3) 估计 2D 视频,把视频放置到文件夹 detectron2/detectron2-infer/videos

bash 复制代码
  cd detectron2/detectron2-infer

  sh infer.sh videos/[your-video-name] [output-video-name-you-want]

  # 结果输出在`output`文件夹
相关推荐
陌陌龙3 分钟前
Sub2API 源码技术分析与搭建教程:把 AI 订阅变成可管理的 API 网关
人工智能
老虎海子3 分钟前
从零入门 OpenAI Codex|登录、权限、终端、记忆配置全实操
人工智能·vscode·自然语言处理·chatgpt·个人开发·业界资讯
与芯同行3 分钟前
TP9243S与TP9311双芯片:AI语音产品从采集到回放的完整解决方案
人工智能
若兰幽竹8 分钟前
【大模型应用】抖音爆款视频深度分析系统:流水线式AI逆向拆解流量密码,精准预测播放量!
人工智能·python·音视频·抖音爆款分析
AI技术控8 分钟前
NeuroH-TGL 论文解读:面向脑疾病诊断的神经异质性引导时序图学习方法
人工智能·语言模型·自然语言处理·langchain·nlp
一只叁木Meow8 分钟前
电商 SKU 选择器:用算法实现优雅的用户交互
前端·javascript·算法
fuquxiaoguang8 分钟前
微软Maia 200的“算力经济学”:推理时代的专用芯片如何改写游戏规则
人工智能·microsoft
心中有国也有家11 分钟前
pytorch-adapter:让 PyTorch 模型“无缝”跑在昇腾 NPU 上
人工智能·pytorch·笔记·python·学习
Sharewinfo_BJ12 分钟前
从手工报表到实时BI:一个零售数据平台的踩坑与重构实战
大数据·人工智能·科技·数据分析·微软·powerbi
代码中介商13 分钟前
红黑树完全指南:从五条性质到完整插入删除实现
数据结构·算法