一站式高质量数字人动画框架——EchoMimic-V3本地部署教程: 13 亿参数实现统一多模态、多任务人体动画生成

一、介绍

EchoMimicV3 是蚂蚁集团在8月底开源的一款高效、多模态、多任务的数字人视频生成框架, 凭借13亿参数的紧凑型视频扩散模型(CVDM),实现了在多种输入条件下快速生成高质量、强泛化能力的数字人动画,为数字人动画技术带来了重要突破。

二、部署过程

快速部署及使用方法,请进入算家云官网, 参考"镜像社区"。

基础环境最低要求说明:

环境名称 版本信息
Ubuntu 22.04
Cuda 12.1.1
Python 3.10
NVIDIA Corporation RTX 4090 D

1、构建基础镜像 Miniconda-Ubuntu-22.04-cuda12.1.1

2、更新系统

sql 复制代码
sudo apt update && sudo apt upgrade -y

更新过程中遇到下图的情况时,在命令行中输入"2"即可

3、创建虚拟环境

ini 复制代码
# 创建一个名为 echomimic_v3 的新虚拟环境,并指定 Python 版本为 3.10
conda create -n echomimic_v3 python=3.10 -y

等待安装完成

bash 复制代码
# 进入虚拟环境
conda activate echomimic_v3

4、从 github 仓库 克隆项目

bash 复制代码
# (如果下载速度过慢可以开启学术代理加速)
git clone https://github.com/antgroup/echomimic_v3.git

5、安装依赖

bash 复制代码
cd echomimic_v3

pip install -r requirements.txt

安装成功

6、模型准备

模型名称 备注
Wan2.1-Fun-1.3B-InP 基础模型
wav2vec2-base 音频编码器
EchoMimicV3-preview 权重

注意:由于Wan2.1-Fun-1.3B-InP和wav2vec2-base模型已经下载到堡垒机里面,所以这里不需要下载。之后在 app_mm.py文件中修改地址即可

6.1 下载权重

  • 创建目录

    bash 复制代码
    cd echomimic_v3
    mkdir -p models
  • 下载元数据(不拉大文件)

    bash 复制代码
    cd models
    GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/BadToBest/EchoMimicV3
  • 拉取大文件

    bash 复制代码
    cd EchoMimicV3/transformer
    git lfs pull
  • 移动transformer文件夹

    bash 复制代码
    mv /echomimic_v3/models/EchoMimicV3/transformer /echomimic_v3/models

7、编辑 app_mm.py文件

7.1 打开 app_mm.py文件,找到第82行左右

修改红框部分:

7.2 打开 app_mm.py文件,找到第326行左右

修改红框部分:

8、运行 app_mm.py文件

css 复制代码
cd echomimic_v3

python app_mm.py --server_name 0.0.0.0 --server_port 8080

运行成功

三、网页演示

出现以下 Gradio 页面,即是模型已搭建完成。

相关推荐
黎阳之光12 小时前
黎阳之光:以视频孪生重构智慧医院信息化,打造高标项目核心竞争力
大数据·人工智能·物联网·算法·数字孪生
东风破_12 小时前
Claude Code 实战指南:像带实习生一样让 AI 帮你维护项目
人工智能
常威正在打来福12 小时前
frontend-design入门指南:OpenClaw/Claude Code/Codex 三平台安装教程
人工智能·aigc·ai编程
百度智能云技术站13 小时前
百度 Agent 安全中心:构筑企业智能体的安全底座
人工智能·安全·dubbo
TechPioneer_lp13 小时前
30 岁硕士 Linux C 开发背景,未来想去澳洲就业,研究方向该选 AI、SDN 漏洞还是 Linux 内核?
linux·人工智能·职业规划·澳洲求职
阿里云大数据AI技术13 小时前
Hologres CLI 与 Skills 担当 Agent-Ready 基础设施,共建数仓智能新生态
人工智能·agent
Terrence Shen13 小时前
大模型部署工具对比
人工智能·深度学习·计算机视觉
视觉&物联智能13 小时前
【杂谈】-企业人工智能超越实验:安全拓展的实践路径
人工智能·安全·aigc·agent·agi
ting945200013 小时前
Kirki 深度技术解析:WordPress 自定义控件开发与可视化配置底层原理
人工智能·架构
掘金一周13 小时前
想换一辆电车,JYM有什么推荐 | 沸点周刊 5.21
前端·人工智能·后端