【论文复现】摩尔线程版AnimateAnyone

code:MooreThreads/Moore-AnimateAnyone (github.com)

paper:Animate Anyone (humanaigc.github.io)

1. Inference

Inference没啥难度,按照readme来就行,就是分开下载权重比较慢,注意权重文件严格按照文档目录树来放。

复制代码
python -m scripts.pose2vid --config ./configs/prompts/animation.yaml -W 512 -H 784 -L 64

默认的参数我cuda.OutOfMemoryError了(服务器12G显存),调小为-W 256 -H 392 -L 32就可以了,但是测试出来的demo效果非常差,视频放不上来

2. Training

Data Preparation

用MEAD数据集试一下

Extract keypoints from raw videos:

复制代码
python tools/extract_dwpose_from_vid.py --video_root /path/to/your/video_dir

Extract the meta info of dataset:

复制代码
python tools/extract_meta_info.py --root_path /path/to/your/video_dir --dataset_name anyone 

Stage1

Stage2

相关推荐
C137的本贾尼33 分钟前
(每日一道算法题)二叉树剪枝
算法·机器学习·剪枝
Blossom.11838 分钟前
使用Python和Flask构建简单的机器学习API
人工智能·python·深度学习·目标检测·机器学习·数据挖掘·flask
MYH5161 小时前
深度学习在非线性场景中的核心应用领域及向量/张量数据处理案例,结合工业、金融等领域的实际落地场景分析
人工智能·深度学习
Lilith的AI学习日记2 小时前
什么是预训练?深入解读大模型AI的“高考集训”
开发语言·人工智能·深度学习·神经网络·机器学习·ai编程
Q同学2 小时前
TORL:工具集成强化学习,让大语言模型学会用代码解题
深度学习·神经网络·llm
禺垣2 小时前
图神经网络(GNN)模型的基本原理
深度学习
柠石榴3 小时前
【论文阅读笔记】《A survey on deep learning approaches for text-to-SQL》
论文阅读·笔记·深度学习·nlp·text-to-sql
我不是小upper3 小时前
SVM超详细原理总结
人工智能·机器学习·支持向量机
白杆杆红伞伞3 小时前
10_聚类
机器学习·支持向量机·聚类
归去_来兮4 小时前
图神经网络(GNN)模型的基本原理
大数据·人工智能·深度学习·图神经网络·gnn