大家好,我是大明哥,目前专注 AI 智能体。
这是大明哥《100 个 Coze 精品案例 》的第 010 个案例:Coze + DeepSeek 制作老祖宗爆款视频"回答我" 。
大明哥相信大部分同学一定刷到过下面这类视频:

被各种"老祖宗"轮番上阵教育,从李时珍,到祖冲之,再到扁鹊,孔子等等。每一个视频好玩又有梗,而且流量还特别高。
老祖宗一句句的质问 "回答我" 贯穿全片,直抵人心。在整个视频中,通过剪短的话术和具有表现力的画面,能够高效传递其核心观点。尤其是那句"look in my eyes",多刷几条视频,脑子里几乎全是这个声音了,能够形成强烈的听觉烙印。
大明哥刷到一个博主的视频,三条视频点赞分别是 15.5 万、41.5万、43.6 万,就问你恐怖不恐怖?

那么,这类视频容易做吗?跟着大明哥做,仅需 4 步就可以完美复刻。
整体思路
整个流程分为 4 个步骤,其中 1 ~ 3 步骤只需要做一遍,第 4 个步骤搭建好工作流后,就是无脑执行工作流了。
- 制作人物形象
- 利用 viggle 生成人物视频
- 获取音频音频
- 搭建工作流
最终的工作流如下:

执行效果:
目前这个工作流已经上传到我的 《100 个Coze精品案例》中来啦!感兴趣的朋友可以看文章末尾联系我一起学习~~
下面就开始动手实现吧!
搭建
制作人物形象
首先我们需要一张老祖宗的图像,这个可以直接到即梦里面去找风格类似的图像,然后简单修改下提示词,在即梦里面运行下就可以了。比如直接输入"老祖宗",找到一个合适的照片:

拿到对应图片的提示词稍微改下就可以了:

利用 viggle 生成人物视频
在利用 Viggle 视频时,我们需要下载一个原版视频,去 B 站搜索"小明剑魔 回答我"就可以了。大明哥帮你准备好了:链接: pan.baidu.com/s/19Ar8gBV8... 提取码: b7wc。
原版视频下载好了,就可以利用 Viggle 将任务形象图片和视频进行融合。
进入网站: viggle.ai(需要魔法),点击 Mix,上传"小明剑魔"视频和制作的任务图片,就可以生成一个视频了:

生成的视频如下:
补充:去飞影直接下载视频
大明哥后面发现了一种更加方便的方案。可以直接去「飞影数字人」官网下载:

点击「回答我」这个视频,进入详情页面就可以直接下载:

制作音频
获取音频有两种方式:
- 一种是去「飞影数字人」官网-声音克隆,找到合适的音频,然后复制它的 id
- 一种是利用 Coze 的插件,提取视频中的音频,然后将其上传到 「飞影数字人」的官网中,制作自己的音频,拿到它的 id
这里详细介绍第二种方案。
Coze 插件:

将这个插件随便插入到一个工作流中,然后上传视频,运行就可以得到对应音频的 URL 了。拿到 URL 后,就将其上传到「飞影数字人」的声音去:

上传完成后,进入该声音的详情页面,复制它的声音 id:

到这里,前期所有的准备工作都已经完成了,下面就进入搭建工作流环节了!!
搭建工作流
整个工作流分为三个步骤:
- 生成文案和调用飞影数字人插件生成视频
- 等待视频的生成
- 给视频配置字幕
生成文案和数字人视频
整个工作流需要输入三个参数:

theme
:视频主题hifly_id
:飞影数字人插件 tokenspeaker_id
:飞影数字人声音 id
大模型生成文案:

生成文案后,在利用「飞影数字人」插件调用其接口生成视频,目前大明哥选择的是「create_lipsync_video」工具:

video_url
这里选择直接上传我们已经处理好的视频就可以了。
等待视频的生成
由于这是一个异步过程,所以我们需要通过循环的方式来判断数字人是否已经生成:

根据文案的长短,一般需要等待 2 ~ 5 分钟。
给视频配置字幕
由于生成的视频没有字幕,所以需要利用「剪映小助手」插件将字幕添加到视频中去:

但是,一个单纯的视频,怎么将字幕与语音对齐呢?所以这里分两步走。先提取视频中的音频,然后利用音频 + 文案来对其音频与字幕,也就是下面这两个插件:

制作好了音频 + 字幕,就制作视频数据。先获取视频的时长,然后根据前面提取的视频 URL 来构建视频数据:

构建好了字幕数据和视频数据,直接利用「剪映小助手」创建草稿并将他们添加到草稿中就可以了:

这样,整个工作流就搭建完成了。最后来看看最终的效果吧:掘金上传视频实在是麻烦,看这里:mp.weixin.qq.com/s/krjYZFMz2...
- 原文可以领取完整提示词、代码、工作流: 点击领取
- 大明哥 AI 觉醒社 | AI 智能体