MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频

扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。

这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了,体验会更加丝滑。

这次我是想将一个儿童故事绘本的工作流发布成MCP,在扣子空间里使用,最终效果就是通过一句话就能生成一个有背景音乐,有人声朗读的儿童故事绘本视频。

在尝试过程中,发现扣子空间的能力和Manus相比还有进步空间,毕竟现在还是beta版本,进展并不如想象中顺利。

最终生成的是一个rap版本的故事绘本视频(至于为什么会做成rap版本,我这里先卖个关子,后面会有解释),这是其中一段:

武松打虎rap视频-b546a90b27

下面详细介绍我的制作过程,其中有不少技巧(坑),也算是摸索了一下当前扣子空间的能力边界。

测试视频生成能力

在正式进行之前,我先做了一个验证测试,确认扣子空间是否有生成视频的能力。

我上传了一张火车票的图片,让扣子空间生成一段音乐,和图片一起合成一段视频。

可以看到扣子空间自己安装了ffmpeg,这个是用来生成视频的软件

Tips: 在我多次尝试过程中,发现并不是每次扣子空间都可以成功安装ffmpeg,如果没有安装成功,可以这样输入指令:

用这个命令安装ffmpeg:apt-get update && apt-get install -y ffmpeg

这样基本上就都能安装成功了。

接下来遇到另外一个坑,生成的视频大小为0,无法播放,经过反复试错,发现可能是因为视频时长过长。

于是修改指令指定生成一段15s长的音乐:

生成15s的舒缓音乐,和附件的图片一起生成一段mp4格式的视频,视频长宽都是720

果然,这样就可以生成有效的视频了,如下:

video3

Tips: 现在扣子空间到底能支持多长的视频生成,我还没有测试过边界,我现在生成过的最长视频是30s

好了,经过以上测试,算是验证了扣子空间生成视频的能力。

可以进行下一步了:将儿童故事绘本工作流引入扣子空间使用

这个过程分为两步:

  1. 将扣子工作流发布成扣子空间的MCP扩展

  2. 在扣子空间中使用这个MCP扩展进行视频创作

下面详细说明如何操作。

发布扣子工作流MCP扩展

说明一下,目前扣子平台只支持将扣子应用发布成MCP(据称后面马上会支持直接将工作流发布成MCP),所以这里我们要多走一步,先创建一个扣子应用。

创建扣子应用

然后将工作流加入应用,界面部分不用管,添加了工作流就可以直接发布成MCP了。

儿童故事绘本的工作流如下,因为这篇文章重点不是介绍扣子工作流,就不展开介绍了,有需要的朋友可以给我留言。

发布成MCP服务

点击右上角的发布进入发布界面以后可以看到,在最右侧有一个MCP服务的选项,点击它就会跳到底部MCP服务那里

这里需要先配置一下,点开配置,勾选全部即可

发布完成

发布完成后,就可以在扣子空间使用了。

扣子空间生成故事视频

按以下步骤操作:

添加扩展

在扣子空间的自定义扩展里可以看到我们刚在扣子平台里发布的这个MCP服务:儿童故事绘本,点击添加。

然后再添加另外两个扣子空间自带的MCP扩展:语音合成(用于生成朗读音频)和音乐生成(用于生成背景音乐),一共3个扩展,如下:

输入指令

这个是我尝试了很多次,才找到的可以成功生成视频的提示词。

相比 Manus 扣子空间的大模型能力还不够强大,遇到问题不太会自己处理,有时候反而需要我给它指令来帮助它解决问题。

比如这里的坑主要是在图片处理上,需要告诉扣子空间将图片下载到本地,否则后面合成视频的时候,无法正确提取到图片。

我之前也测了不少Manus的案例,如果是Manus,这种问题它应该会自己搞定。

终于,视频成功生成了

但是还有个问题,生成的背景音乐,无论我怎么修改提示词(试了差不多十遍),它始终会有人声,无法生成纯音乐,这个就很无语了,效果是这样滴:

武松打虎绘本视频-1bd6b01b1f

所以我最后只能选择不要朗读音频或者不要背景音乐。

然鹅,我突然灵机一动,如果把故事内容作为音乐的歌词呢?这不就完美解决了朗读和音乐结合的问题嘛,而且还颇有新意,于是开头的那个rap视频就是这么来的~~

当然还是期待将来会有支持生成纯音乐的扩展。

写在最后

这算是一次有趣的尝试,对扣子空间当前的能力做了一次探索。虽然说不算完美,但是整个流程是跑通的,这个非常重要。

扣子空间有自己的平台优势,因为它有扣子平台巨量的用户和工作流,这两者打通以后,会产生巨大的化学反应。

扣子空间现在还在beta版本,不能苛求它多完美,但是未来绝对可期。

比如,将来如果把图生视频的MCP接入进来,那么在现在这个demo基础上,我就可以通过一句话做出有动画效果的故事视频了,想想都非常期待~~

更多精彩内容推荐:

-> AI智能体学习&实战

-> 私域AI机器人

-> 自媒体AIP打造

-> AI应用

相关推荐
今天也想MK代码40 分钟前
基于WebRTC的实时语音对话系统:从语音识别到AI回复
人工智能·webrtc·语音识别
Vizio<1 小时前
基于CNN的猫狗识别(自定义CNN模型)
人工智能·笔记·深度学习·神经网络·cnn
kovlistudio1 小时前
机器学习第十三讲:独热编码 → 把“红黄蓝“颜色变成001/010/100的数字格式
人工智能·机器学习
豆豆1 小时前
机器学习 day03
人工智能·机器学习
qyresearch_2 小时前
砷化镓太阳能电池:开启多元领域能源新篇
人工智能
山海不说话2 小时前
深度学习(第3章——亚像素卷积和可形变卷积)
图像处理·人工智能·pytorch·深度学习·目标检测·计算机视觉·超分辨率重建
2201_754918412 小时前
深入理解 OpenCV 的 DNN 模块:从基础到实践
人工智能·opencv·dnn
-一杯为品-2 小时前
【深度学习】#12 计算机视觉
人工智能·深度学习·计算机视觉
蹦蹦跳跳真可爱5892 小时前
Python----神经网络(《Searching for MobileNetV3》论文概括和MobileNetV3网络)
人工智能·python·深度学习·神经网络
妄想成为master2 小时前
如何完美安装GPU版本的torch、torchvision----解决torch安装慢 无法安装 需要翻墙安装 安装的是GPU版本但无法使用的GPU的错误
人工智能·pytorch·python·环境配置