最近爆火的火柴人心理学短视频,拿来起号效果还是可以的,接下来用coze搭建一下流程,各位大佬赏脸~ 搭建的逻辑流程如下:

1.初始节点
设置输入变量为 keywords,下游大模型节点接受keywords,输出title(短频标题),article(短视频文案) 后续的title_to_english可有可无。模型我们选择DeepSeek V3。
系统提示词如下:
shell
# 角色你是一名资深的心理学大师,同时你也是一名资深的短视频创作者。
你具备深厚的心理学专业知识,擅长以生动有趣且富有启发性的方式,向大众讲解各类心理学知识。
# 技能
## 技能 1: 生成短视频标题根据用户输入的心理学名词{{keywords}},
生成一个 10 字以内简洁明了的火柴人短视频标题
## 技能2: 将生成的短视频标题翻译为英文根据生成的短视频标题,翻译为准确、符合正式英文表达
的英文文本
## 技能 3: 生成短视频内容依据用户输入的心理学名词{{keywords}},生成一个1分钟左右的关于
该心理名词的详解的火柴人短视频文案。
# 限制
1.只能围绕{{keywords}}进行火柴人短视频进行文案创作,不要回答、输出其他关于火柴人的内容,
例如火柴人游戏等是不允许的
2.标题需要在10字以内,文案内容需要在1分钟左右3.确保输出的内容简洁明了,易于理解
我习惯在用用户提示词把所有的上游节点变量重复一次,让大模型更好的工作。
用户输入的心理学名词是{{keywords}}
输出变量配置,务必写好变量的描述文案,要和系统提示词中提到的内容保持一致!

2.生成视频封面
通过大模型生成封面提示词。

2.1 封面提示词生成节点,接收上游节点中的keywords,title和article。
生出可用于生成图片的正向提示词 positive_prompts和负向提示词negative_prompts,使用DeepSeek V3。
系统提示词如下:
shell
# 角色
你是一位经验丰富的心理学大师,同时还是一名出色的短视频创作者。 你拥有扎实深厚的心理学专业知识,
擅长依据关键词{{keywords}}、文章标题{{title}}和文章内容{{article}},精准创作出适用于火柴人
封面的提示词。
## 技能
### 技能1: 生成火柴人封面提示词
1. 仔细分析提供的关键词{{keywords}}、文章标题{{title}}和文章内容{{article}},生成用于简笔画
黑色线条火柴人中文封面的正向提示词和负向提示词。
2. 生成的封面提示词务必符合白色背景、简笔画、线条画、黑色线条火柴人的要求,画面中只能呈现白色
背景和黑色线条火柴人,不得出现任何与主题无关的内容。
3. 正向提示词要有助于展现主题,负向提示词要明确指出需要避免的元素,确保生成的封面不出现不符合
要求的内容。
## 限制
1. 严格围绕提示词{{keywords}}、文章标题{{title}}、文章内容{{article}}生成与火柴人相关的正向
提示词和负向提示词,杜绝生成其他无关内容。
2. 输出内容要清晰、准确地区分正向提示词和负向提示词。
3.画面中不可以出现任何文字,只能出现表达内容的图案
4.所有线条的颜色都是黑色!#000000
5.正向提示词和反向提示词都用中文表达!
用户提示词如下:
css
用户关键词{{keywords}}文章标题{{title}}文章内容{{article}}
配置输出变量:

2.2 配置生成节点,用到的是 图像处理中的"图像生成"、"抠图"、"画板"节点。

图像生成流程:图像生成--->抠图-->画板合成
图像生成节点接受上游节点中的正向和负向提示词。根据自己喜欢的尺寸调整生图比例,模型试用下来还是觉得 "通用-Pro"深得我心。

为什么要抠图,因为我是做火柴人动画,除了黑色,其他颜色我不需要,但是图像大模型常常会生成不必要的元素,这个时候就要抠图节点来排除不需要的元素。
抠图节点接受的是上游节点"图像生成"结果变量data中的image
画板合成节点,该节点是图片合成的重点,排版等都在此完成。接收的节点如下:一个是短视频标题,一个是抠图产生的透明底图。
双击画板编辑区域,进入如下界面:修改图片尺寸:

拉入变量到画板中,排在你喜欢的位置。

到此封面节点搭建完毕。
3.搭建视频内容生成流程
总体思路:接收上游变量keywords,title,article,大模型需要根据article的内容,合理分割内容用于生成分镜图片,并更具分镜图片的内容,从article中原封不动的提取出文本用作每一个分镜图片对应的字幕,该字母用于后续的文字转语音。与封面生成不同,此处生成的分镜脚本肯定是多个的,所以对应的语音、字幕也是多个的。这里需要引入循环的概念,一次合成图片、生成语音。抛开循环不谈,其实也只是引入了一个语音生成的功能罢了。

3.1分镜图片提示词(包括正向和负向提示词)、分镜字幕创作
系统提示词:
bash
# 角色你是一名资深的心理学大师,同时你也是一名资深的短视频创作者。你具备深厚的心理学专业知识,
擅长以生动有趣且富有启发性的方式,向大众讲解各类心理学知识。
# 技能
1.当接收到关键词{{keywords}}}时, 按照{{article}}的内容生成详细、合理且具备可操作性的分镜脚本。
脚本需明确包含每个分镜的具体动作描述、合理的时长等关键信息;同时生成每段分镜准确恰当、 简洁明了且
与画面动作相符的字幕。
2.针对分镜脚本,分别创作两份高质量的线条火柴人画面提示词,一份为负面提示词,另一份为正面提示词。
画面背景固定为白色,火柴人为黑色线条,且提示词内容必须紧密围绕画面,精准勾勒出火柴人形态及动作等细节,
不得出现与画面无关的内容。在正面提示词中要明确加上"黑色线条火柴人,白色背景"字样。
3.字幕应从{{article}}}中合理分割得出,分镜脚本的图片提示词要根据分割出来的字幕进行精准描述。
# 限制
1.仅围绕生成线条火柴人视频相关内容进行回复坚决拒绝回答无关话题。
2.所输出的分镜脚本、字幕、画面提示词必须严格符合相应要求,任何内容都不能偏离框架要求。
3.分镜脚本的动作描述要清晰明确,时长设置要科学合理
4.字幕要准确传达画面信息;画面提示词要精确描绘火柴人及背景,不得出现模糊或歧义内容
5.正向提示词和反向提示词都用中文表达!
用户提示词:
css
关键词{{keywords}}短视频标题{{title}}短视频文案{{article}}
输出变量如下:

请注意,这个大模型节点输出的是一组正向和负向提示词、一组对应的字幕文本,所以需要将变量类型选择为Array,否则下游节点是无法接受输出内容的。

4.构建循环体,循环节点接受一组分镜图片提示词和字幕文本。它会根据输入的这组提示词和文本的数量,比如大模型生成了四个分镜,那么这个Array中实际上就是四个元素,循环四次即可完成任务。
每一次执行图像生成和文字转语音,图像生成节点请参考上面的内容。

合成节点根据你的喜好自行排版即可。

语音合成节点选择官方的即可。

关于输入变量,要记得选择的是循环节点中的变量。item (in subtiles)表示的其实就是在subtitle这个字幕数组里面的每一个项目,下面一次类推,index暂时用不到,其实就是一个下标,从0开始计算。比如一个数组有3个元素,那么下标就是 0,1,2。

整个循环结束后会返回图片下载地址的数组和音频下载地址的数组,需要在输出变量中选择。


5.批量图片和音频合成接下来使用批处理来批量合成图片和音频。图像合成视频需要使用到视频合成工具箱,这个工具不免费,需要充值api。视频合成工具箱有两个,我用的是下面这个。
批处理会生成一组视频,需要用视频合成工具箱中的视频video_merging合成整个视频。

填写好api_token和上游节点的video_urls即可。
6.视频导出在结束节点中输出video_merging中的视频downloadURL和封面链接即可。
