【coze】故事卡片(图片、音频、文字)

【coze】故事卡片(图片、音频、文字)

1、创建智能体

从左侧找到工作空间,切换为个人空间,点击右上角创建

选择智能体进行创建

智能体名称:故事卡片生成

智能体功能介绍:根据提示词生成带图片、音频、文字的故事小卡片

2、添加人设与回复逻辑

bash 复制代码
## 角色
你是一个音频故事生成助手,你可以按照用户的要求,生成最终的内容,你工作时请注意:

## 要求
1、生成故事文字,不低于100字,不超过200字,并将故事的文字进行输出
2、用故事文字生成音频,将音频文件原始链接输出,不需要输出成可点击的文字链接
#3、给故事的每一个场景生成图片,将图片输出,整个故事不超过3张图片,图片风格全部采用迪士尼风格

## 工具使用
你在完成用户任务的过程中可以使用story工作流

3、添加工作流

(1)创建工作流

工作流名称:story

工作流描述:故事生成工作流

(2)添加大模型节点

将大模型和开始节点相连

配置模型为DeepSeek-V3

大模型输入为开始节点的input

系统提示词如下:
你在完成用户任务的过程中可以输出以下内容:
1、故事内容story
2、故事配图提示词picture

用户提示词为:{{input}}

添加两个输出变量,分别为storypicture

(3)添加提示词优化节点

为了让图片生成的效果更好,通常需要添加提示词优化

将大模型与提示词优化节点相连

设置提示词为大模型节点的picture

(4)添加豆包图像生成

搜索豆包图像生成 ,找到gen_image 点击添加

将图像生成节点和提示词优化节点相连

图像生成节点的prompt为提示词优化节点的data

req_schedule_conf为固定值general_v20_9B_pe

(5)添加语音朗读插件

搜索语音合成,点击添加

将语音合成和大模型相连

配置语音合成的text为大模型的story

speaker_id为爽快思思/Skye

(6)添加输出节点

连接输出节点

添加输出节点参数,分别是story、picture、audio

设置story参数为大模型节点的story

设置picture参数为图片合成节点的image_urls

设置audio参数为语音朗读节点的link

(7)结束节点设置

将输出节点与结束节点相连

删掉结束节点的输出,这里不需要输出内容

(8)工作流试运行

输入讲个故事 ,点击试运行

我们可以看到,输出节点三个参数均有数据,如果显示失败,重新试运行即可

(9)发布并添加工作流

版本描述就写工作流的描述就行:故事生成工作流

然后点击发布

发布完成后,会弹窗提醒是否添加至智能体,点击确认

如果上一步不小心把弹窗关了,也可以手动添加刚刚创建的工作流

4、卡片设计

(1)新增卡片

在工作流上,点击绑定卡片数据

选择输出下面的绑定卡片

新增一个卡片

(2)设置图片

在组件中,找到图片控件,拖拽进编辑区

点击图片区域,一定要点击图片,不要点击外框

设置图片为宽度铺满模式

点击(x)图标,点击新建变量

变量名:picture

默认值可以随便写,也可以设置系统默认图标链接
https://lf-card-builder.oceancloudapi.com/obj/bot-studio-builder/4004860678112580_1706003508909477605.png

再次点击(x)图标,绑定刚刚新建的picture变量

(3)设置音频

在组件中,找到音频,拖拽进编辑区

在左侧选择变量,点击新建变量

变量名称:audio

变量默认值:随便写即可,我这里写了个mp3

点击音频播放条,选择变量,选择刚刚新建的audio变量

(4)设置故事文字内容

再新建一个变量

变量名:story

变量默认值:随便敲个空格即可

将文本组件拖拽进工作区

点击文本组件,点击右上角的(x)图标

选择story变量

(5)卡片命名及发布

给卡片起个名字:故事小卡片

点击右上角发布

点击确定即可

(6)绑定数据

单击故事小卡片,把story、audio、picture按如下图所示进行配置,配置完成点击确认

5、模型选择和设置

智能体支持多种大语言模型,点击下拉菜单,选择自己喜欢的大模型作为引擎进行回复。当然也可以添加多个模型,进行"模型对比调试"

这里我选择"DeepSeek-V3"模型。

6、测试智能体

测试之前,先优化一下提示词

把提示词中的story删掉,输入{会自动弹出窗口,添加story工作流

添加完后如下图所示,这样做的目的是让系统更稳定的调用工作流

发送测试问题:最近有什么节日,写一个故事给4岁小女孩

点击运行完毕图标,可以查看插件调用详细信息

7、发布智能体

默认为coze商店发布,如果有其他需求自行勾选

发布成功可以对话,也可以复制链接发给别人

相关推荐
2501_915374354 分钟前
深入理解 TensorFlow 的模型保存与加载机制(SavedModel vs H5)
人工智能·tensorflow
一点.点15 分钟前
PyTorch常用命令(可快速上手PyTorch的核心功能,涵盖从数据预处理到模型训练的全流程)
人工智能·pytorch·深度学习
贝塔西塔16 分钟前
时间序列数据集构建方案Pytorch
人工智能·pytorch·深度学习
灏瀚星空17 分钟前
深度学习之LSTM时序预测入门指南:从原理到实战
人工智能·python·深度学习·神经网络·机器学习·数学建模·lstm
聚客AI35 分钟前
企业级RAG架构设计:从FAISS索引到HyDE优化的全链路拆解,金融/医疗领域RAG落地案例与避坑指南(附架构图)
人工智能·语言模型·自然语言处理·ai大模型·rag·llamaindex·deepseek
董厂长2 小时前
LLM :Function Call、MCP协议与A2A协议
网络·人工智能·深度学习·llm
Elastic 中国社区官方博客2 小时前
Elasticsearch:我们如何在全球范围内实现支付基础设施的现代化?
大数据·人工智能·elasticsearch·搜索引擎·全文检索·可用性测试
HUIBUR科技2 小时前
人工智能与智能合约:如何用AI优化区块链技术中的合约执行?
人工智能·ai·智能合约
当当狸3 小时前
当当狸智能天文望远镜 TW2 | 用科技触摸星辰,让探索触手可及
人工智能·科技·内容运营
geneculture3 小时前
金融的本质是智融、融资的实质是融智、投资的关键是投智,颠覆传统金融学的物质资本中心论,构建了以智力资本为核心的新范式
大数据·人工智能·算法·金融·系统工程融智学