MimicTalk:字节跳动和浙江大学联合推出 15 分钟生成 3D 说话人脸视频的生成模型

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. MimicTalk 是字节跳动和浙江大学联合开发的基于 NeRF 技术的 3D 说话人脸视频生成模型。
  2. 该模型能够在 15 分钟内生成个性化且富有表现力的 3D 说话人脸视频。
  3. MimicTalk 支持音频驱动生成特定人物的说话头像,显著提高了视频质量和训练效率。

正文(附运行示例)

MimicTalk 是什么

MimicTalk 是一种基于 NeRF(神经辐射场)技术的 3D 说话人脸视频生成模型,由字节跳动和浙江大学共同研发。该模型能够在极短时间内(仅需 15 分钟)生成个性化且富有表现力的 3D 说话人脸视频,显著提高了训练效率和视频质量。

MimicTalk 的主要功能

  • 快速个性化训练:在 15 分钟内完成对新身份的适应和训练。
  • 高质量视频生成:生成的视频在视觉质量上超越以往技术。
  • 表现力增强:捕捉和模仿目标人物的动态说话风格。
  • 上下文学习:从上下文中学习目标人的说话风格,提高面部动作的自然度。
  • 音频驱动:支持用音频输入驱动特定人物的 3D 说话头像。

MimicTalk 的技术原理

  • 人-不可知 3D 人脸生成模型:预训练的通用 3D 人脸生成模型,能处理单张图片输入。
  • 静态-动态混合适应流程:学习特定身份的静态外观和动态特征,基于优化 3D 人脸表征和低秩适应技术。
  • 上下文风格化的音频到运动模型(ICS-A2M):生成与目标人物说话风格相匹配的面部动作。
  • Flow Matching 模型:预测数据点的速度场,指导数据点从先验分布向目标分布移动。
  • 推理过程:结合音频输入与参考视频,生成高质量的说话人脸视频。

如何运行 MimicTalk

安装环境

请参照环境配置文档,配置 Conda 环境mimictalk

下载预训练与第三方模型

3DMM BFM 模型

下载 3DMM BFM 模型:Google Drive

预训练模型

下载预训练的 MimicTalk 相关 Checkpoints:Google Drive

MimicTalk 训练与推理的最简命令

bash 复制代码
python inference/train_mimictalk_on_a_video.py # 训练模型
python inference/mimictalk_infer.py # 推理模型

资源

  • 关注并回复公众号【58】或【MimicTalk】获取相关项目资源。

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关推荐
周润发的弟弟21 分钟前
2025年Java在中国开发语言排名分析报告
人工智能
杭州泽沃电子科技有限公司24 分钟前
工业环境电缆火灾预防的分布式光纤在线监测
运维·人工智能·科技·安全
没有梦想的咸鱼185-1037-166325 分钟前
AI大模型支持下的:CMIP6数据分析与可视化、降尺度技术与气候变化的区域影响、极端气候分析
人工智能·python·深度学习·机器学习·chatgpt·数据挖掘·数据分析
Code_流苏32 分钟前
DeepSeek V3.1深度解析:一个模型两种思维,迈向Agent时代的第一步!
开源·agent·思维·模型设计·deepseek·深度思索·dpv3.1
柠檬味拥抱1 小时前
基于自适应信号处理的AI Agent多任务协同控制方法研究
人工智能
唐丙斯城1 小时前
新能源汽车热管理仿真:蒙特卡洛助力神经网络训练
人工智能·神经网络·汽车
楚禾Noah2 小时前
【设计模式实战】原型模式 + 工厂模式:AI Agent 配置中心
人工智能·设计模式·原型模式
灵智工坊LingzhiAI2 小时前
基于深度学习的中草药识别系统:从零到部署的完整实践
人工智能·深度学习
今天也要学习吖2 小时前
Azure TTS Importer:一键导入,将微软TTS语音接入你的阅读软件!
人工智能·学习·microsoft·ai·大模型·aigc·azure
星期天要睡觉2 小时前
(纯新手教学)计算机视觉(opencv)实战八——四种边缘检测详解:Sobel、Scharr、Laplacian、Canny
人工智能·opencv·计算机视觉