Coze扣子 - AI生成数字人口播视频

一、数字人介绍

数字人(Digital Human)是指利⽤先进的数字技术和⼈⼯智能创建的虚拟人 类形象,能够模拟⼈类的外貌、⾏为和情感。数字⼈不仅可以在视觉上表 现出真实的⼈类特征,还可以通过⾃然语⾔处理与⽤户进⾏互动。

Coze 通过全链路AI⽣成技术,实现从⽂案-->语⾳-->数字⼈的⽆缝衔接,打 造"输⼊需求,输出完整数字⼈内容"的⼀站式平台。

⽤户仅需输⼊⽂案或关键词,AI⾃动⽣成配套语⾳及数字⼈视频。

二、Coze - 全链路AI数字内容生成引擎

2.1 数据准备

在生成数字人之前,我们需要准备以下数据:

  • **⽂案⽂本:**大模型生成

  • **⾳⾊:**飞影数字人-声音克隆【见下方3.2章节】

  • **视频模板:**录制一段自己(他人)出境的视频,建议嘴型表情丰富生动。

2.2 生成步骤

2.2.1 基于⼤模型和输⼊的提示词⽣成⽂案(⼝播内容);

2.2.2 基于⽣成⽂案和⾳⾊⽣成⾳频⽂件;

2.2.3 基于⾳频⽂件和准备好的视频素材⽣成最后的⼝播视频;

2.3 coze工作流具体实现

2.3.1 注册登录扣子

扣子

2.3.2 创建智能体

2.3.3 添加工作流

2.3.4 添加大模型节点-文案生成

大模型节点主要用来生成文案

2.3.5 添加插件-飞影数字人

使用飞影数字人插件用来生成数字人视频

节点输入参数说明:

2.3.6 循环查看状态

因为视频生成时间不确定,所以我们需要添加一个循环体,循环去查询视频的状态,只有

2.3.6.1 配置循环体:先在循环体中添加飞影插件inspect_video_creation_status

2.3.6.2 添加选择器节点:如果status=2则继续循环(提交生成视频请求会生成job ID,但生成视频需要一定时间,所以我们需要不断循环查询生成状态)

2.3.6.3 在选择器如果后添加插件:搜索定时器-变量值写10(即每10秒查询一次,防止请求频繁,上限1000次)

2.3.6.4 选择器否则后添加插件:终止循环

2.3.7 结束节点

在循环后接入结束节点-如下图:

三、飞影数字人

3.1 注册登录飞影

飞影数字人 - 官方创作入口

3.2 声音克隆--speaker_id

上传自己的音频文件,即可生成

公共声音库:

公共声音库--》点击任意一个--》更多--》复制声音ID

3.3 hifly_id

相关推荐
后端小肥肠6 分钟前
【n8n入门系列】3 种方法搞定 n8n 生图!最多3步,小白也能学会的自动化教程
人工智能·openai·agent
Python算法实战11 分钟前
腾讯送命题:手写多头注意力机制。。。
人工智能·算法·面试·大模型·强化学习
Rock_yzh18 分钟前
AI学习日记——PyTorch深度学习快速入门:神经网络构建与训练实战
人工智能·pytorch·python·深度学习·神经网络·学习
razelan1 小时前
第一例:石头剪刀布的机器学习(xedu,示例15)
人工智能·机器学习
一条星星鱼1 小时前
从0到1:如何用统计学“看透”不同睡眠PSG数据集的差异(域偏差分析实战)
人工智能·深度学习·算法·概率论·归一化·睡眠psg
TMT星球1 小时前
TCL华星t8项目正式开工,总投资额约295亿元
大数据·人工智能
猫头虎1 小时前
DeepSeek刚刚开源了一个3B的 OCR模型:什么是DeepSeek-OCR?单张A100-40G每天可以处理20万+页文档
人工智能·开源·whisper·prompt·aigc·ocr·gpu算力
lky不吃香菜1 小时前
上下文工程的艺术与科学:来自 LangChain 和 Manus 的前沿洞察
人工智能
香菜烤面包1 小时前
Attention:MHA->MQA->GQA->MLA
人工智能·深度学习
阿里云大数据AI技术1 小时前
云栖实录 | 驶入智驾深水区:广汽的“数据突围“之路
大数据·人工智能