【论文复现】摩尔线程版AnimateAnyone

code:MooreThreads/Moore-AnimateAnyone (github.com)

paper:Animate Anyone (humanaigc.github.io)

1. Inference

Inference没啥难度,按照readme来就行,就是分开下载权重比较慢,注意权重文件严格按照文档目录树来放。

复制代码
python -m scripts.pose2vid --config ./configs/prompts/animation.yaml -W 512 -H 784 -L 64

默认的参数我cuda.OutOfMemoryError了(服务器12G显存),调小为-W 256 -H 392 -L 32就可以了,但是测试出来的demo效果非常差,视频放不上来

2. Training

Data Preparation

用MEAD数据集试一下

Extract keypoints from raw videos:

复制代码
python tools/extract_dwpose_from_vid.py --video_root /path/to/your/video_dir

Extract the meta info of dataset:

复制代码
python tools/extract_meta_info.py --root_path /path/to/your/video_dir --dataset_name anyone 

Stage1

Stage2

相关推荐
m0_6924571028 分钟前
阈值分割图像
图像处理·深度学习·计算机视觉
ys~~37 分钟前
git学习
git·vscode·python·深度学习·学习·nlp·github
光羽隹衡1 小时前
机械学习逻辑回归——银行贷款案例
算法·机器学习·逻辑回归
能源系统预测和优化研究2 小时前
创新点解读:基于非线性二次分解的Ridge-RF-XGBoost时间序列预测(附代码实现)
人工智能·深度学习·算法
执笔论英雄2 小时前
【RL】ROLL下载模型流程
人工智能·算法·机器学习
لا معنى له2 小时前
目标分割介绍及最新模型----学习笔记
人工智能·笔记·深度学习·学习·机器学习·计算机视觉
宁大小白3 小时前
pythonstudy Day40
python·机器学习
万里鹏程转瞬至3 小时前
论文简读:Qwen2.5-VL Technical Report
论文阅读·深度学习·多模态
Coding茶水间3 小时前
基于深度学习的水下海洋生物检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
roman_日积跬步-终至千里4 小时前
【人工智能导论】05-学习-机器学习基础:从数据到智能决策
人工智能·学习·机器学习