扣子Coze实战:一键打造自己的口播数字人视频(保姆级教程)

大家好,我是汤师爷,专注AI智能体分享~

相信有不少朋友在问,有没有办法不出境,也能拍出专业的口播视频?

毕竟很多时候,我们想分享内容,却因为不敢出镜,迟迟不敢开始。

录制视频时总是觉得自己表情不自然,一遍遍重录。

新手拍摄常见的三大难题,让很多人望而却步:

1. 镜头恐惧

面对镜头时容易紧张、结巴,甚至完全忘记准备好的台词。

很多人需要反复拍摄几十次才能完成一个简单的片段,这严重影响了拍摄效率。
2. 表现力不足

即使克服了紧张感,很多新手在镜头前依然显得生硬、不自然。

语气平淡、表情僵硬、肢体动作不协调等问题需要大量练习才能改善,这个过程往往需要几个月甚至更长时间。
3. 成本压力

想要制作优质视频,投入成本远超很多人的想象。

不仅要租用专业的场地和设备(如补光灯、摄像机、收音设备等),还需要聘请专业团队(包括化妆师、摄像师、剪辑师等),这些支出加起来往往让创作者望而却步。

今天我就教你搭建一个口播数字人智能体,不露脸也能轻松搞定。

借助Coze工作流,直接用文案就能生成逼真的数字人口播视频。

篇幅不短,欢迎先收藏,再慢慢看。如果觉得有帮助,也请顺手点个赞、在看、转发支持一下~

1.选择数字人插件

Coze本身并没有提供官方的数字人插件,但市面上却有很多第三方插件可以用。

今天我们要用到的,就是「飞影数字人插件」。

插件这么多,我们怎么选呢?

建议大家关注几个核心指标:智能体使用数、调用量、成功率、执行时间。

这些数据,可以帮助我们快速筛选出优质的插件。

2. 前期准备阶段

在搭建口播数字人智能体之前,需要准备以下任务:

  1. 登陆飞影官网(https://hifly.cc?promoterCode=XmcyWURYbnVW77Vn
  2. 克隆自己的专属数字人形象备用。
  3. 克隆自己的声音备用。

完成数字人和声音克隆后,我们就可以开始搭建口播数字人智能体了。

3.智能体的搭建流程

智能体的搭建流程主要分为两个步骤:梳理工作流、设置智能体。

3.1 梳理工作流

将口播数字人视频创作流程,转化为可自动化运行的工作流节点。

  1. 通过开始节点,收集必要的参数
  2. 使用飞影数字人插件,一键生成数字人视频
  3. 监控数字人的任务状态,直到任务完成
  4. 输出数字人的视频链接

3.2 设置智能体

  1. 设置人设与逻辑:配置口播数字人智能体的决策逻辑
  2. 设置快捷指令:配置智能化的快捷指令,让智能体更快速、便捷地响应用户的需求
  3. 测试并发布:全面的功能测试,确认正常后,将智能体正式发布到生产环境

4.创建工作流

登录Coze官网,在"资源库-工作流"里新建一个空白工作流,取名"spoken_digital_human"。

3.1 开始节点

  • 输入:
    • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
    • speaker_id:克隆声音 ID
    • digital_human_id:克隆数字人 ID
    • text:视频文案

关于hifly_id、speaker_id、digital_human_id如何获取,下文会重点介绍。

3.2 一键生成数字人视频

我们将使用【飞影数字人】插件的create_lipsync_video2功能。

通过这个功能,我们可以一键生成口播数字人视频。

我们选择飞影数字人插件的create_lipsync_video2功能,插件节点命名为【一键生成数字人视频】

  • 输入:
    • hifly_id:开始 - hifly_id
    • speaker_id:开始 - speaker_id
    • digital_human_id:开始 - digital_human_id
    • text:开始 - text

3.3 设定循环,每10S监控任务的状态

数字人视频生成通常需要几分钟,我们会用任务查询插件,设定一个无限循环,每隔10秒就自动检查一次。

当插件返回任务完成状态时,就会自动停止循环,生成的视频链接就能顺利拿到。

我们将设定【循环】节点,每10S监控任务的状态。

  • 循环设置:无限循环
  • 输出:
    • output:监控数字人的任务状态 - video_Url

3.5 配置循环体

1.我们将使用【飞影数字人】插件的inspect_video_creation_status功能。

监控任务的状态,当任务完成后,输出数字人视频的链接。

  • 输入:
    • job_id:作品ID,一键生成数字人视频-job_id
    • hifly_id:开始-hifly_id

2.通过选择器节点,判断任务是否完成。

如果监控数字人的任务状态 - status = 2,说明视频还在生成中。

3.如果视频还在生成中,则使用【定时器】插件,等待10秒。

  • 输入:
    • seconds:等待时间

4.如果视频生成完成,则使用【终止循环】插件。

3.6 结束节点:输出数字人视频链接

  • 输出:
    • output:设定循环,每10S监控任务的状态-output

这样,工作流就搭建好了,最后点击发布工作流。

4.创建智能体

4.1 新建智能体

在Coze平台创建一个新的智能体,命名"口播数字人智能体"。

4.2 设置人设与逻辑

配置智能体的特征、回复风格和决策逻辑。

markdown 复制代码
# 角色
你是口播视频生成神器,负责处理用户上传的视频、文本或音频,生成专属定制数字人视频,并提供相关服务。

## 技能
### 技能 1: 生成并反馈视频
1. 接收用户上传的视频、文本或音频后,启动名为"数字人视频生成"的工作流进行处理。
2. 在工作流运行完毕后,向用户展示生成的视频链接,并建议用户复制链接下载视频。

## 限制
- 严格在"数字人视频生成"工作流运行结束后,按要求展示视频链接并给出下载建议。
- 将"数字人视频生成"工作流添加进智能体。

4.3 设置快捷指令

1.按钮名称:根据文本,生成口播数字人视频

2.指令名称:digital_human

3.工具:直接使用工作流

4.指令内容:生成数字人视频 {{digital_human_id}}{{hifly_id}}{{speaker_id}}{{text}}

4.4 测试并发布

全面的功能测试,确认正常后,将智能体正式发布到生产环境。

1.点击快捷按钮:根据文本,生成口播数字人视频

2.获取hifly_id

hifly_id就是飞影数字人会员的秘钥,hifly_agent_token,在个人中心获取。

3.获取speaker_id

speaker_id是克隆声音 ID,在声音克隆菜单下,获取声音 ID。

4.获取digital_human_id

digital_human_id是克隆数字人 ID,在数字人菜单下,获取素材 ID。

5.填写所有参数,并测试智能体

  • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
  • speaker_id:克隆声音 ID
  • digital_human_id:克隆数字人 ID
  • text:视频文案

执行后,会输出数字人视频的链接:

最后,用剪映给视频加上音乐和字幕,就可以生成最终的口播视频啦~

5.总结

通过本文的介绍,我们学会了如何使用Coze工作流和飞影数字人插件,轻松打造一个专业的口播数字人智能体。

这套方案不仅让我们摆脱了出镜的困扰,还能大大提升内容创作的效率。

希望这个方法能帮助你更好地传递价值,创作出更多优质的内容。

如果你觉得这篇文章对你有帮助,欢迎点赞、收藏,不迷路,并转发给有需要的朋友

你的每一次互动都是我持续创作的动力!感谢支持~

对了,我整理了一份开源《智能体学习手册》,爆肝 10 万字,价值 999 元。限时开放领取👉:tangshiye.cn