一键生成像素风格视频——咖啡屋的浪漫邂逅

导航

  • 前言
  • 工作流实现效果
  • 操作步骤
  • 调试
  • 下载草稿
  • 用剪映打开草稿
  • 结语
  • 参考

前言

近来,一种像素画风的短视频在各大社交平台悄然走红,不仅频频创下10w+的播放量记录,更赢得了广大用户的青睐。

与传统简单拼接图片、字幕和音频的粗糙制作不同,这类短视频充分发挥了AI技术的优势:既能将人物场景动态化呈现,又能构建完整的情节内容。

每个场景都经过精心设计,形成独立的视频片段,人物与背景自然融合、相得益彰。

整体观感堪比一部制作精良的微电影,令人耳目一新。

那么这个是怎么实现的?

其实,通过AI工作流可以比较简单地实现这样风格的短视频。

今天给大家分享一下,我是如何一步一步搭建工作流的。

欢迎点赞、收藏、关注。

工作流生成视频的效果

工作流程展示

操作步骤

1、创建工作流

登录扣子(coze)平台:https://www.coze.cn/studio

  • 选择"开发平台"->"快速开始"
  • 在左侧选择"+",选择"创建应用",给应用起一个名称,并选择"确认"
  • 在左侧资源库页面右上角单击 +资源,并选择工作流。
  • 设置工作流的名称与描述,并单击确认。

如果没有账户,可以先注册一个,coze空间已经全面开开放,免费使用。

2、开始节点

开始节点,作为入口。

设置两个变量,一个是"biaoti",另一个是"wenan",见名知义,都是字符串类型(String)。

  • biaoti:用户输入视频的主题
  • wenan:用户输入视频的文案,选填,如果不输入,大模型会根据主题自动生成文案

这里要求至少有一个填写

3、IF 选择器

连接多个下游分支,若设定的条件成立则仅运行对应的分支,若均不成立则只运行"否则"分支

if选择器,判断用户是否输入"wenan",如果没有输入,则先根据主题生成文案。

4、生成文案内容

设置两个变量,一个输入参数是"title",另一个输出参数"output",都是字符串类型(String)。

  • title:用户输入的主题,即开始节点中的"biaoti"参数
  • output:调用大模型生成的文案内容

系统提示词:

md 复制代码
# 角色
# 角色
你是一个心理学知识分享博主,善于通过理论解读和案例分析,帮助读者理解心理现象背后的原理,用通俗易懂的方式呈现心理学的智慧。

## 技能 创作心理学科普文案
- 目标:依据用户提供的标题,创作具有启发性和实用性的的心理科普文章。
- 文章结构:采用总分结构,开篇引出主题,分段闹述心理学理论与实际应用,结合案例进行说明,结尾总结要点并提供行动建议。
- 案例生动呈现:选取贴近生活的案例,从情境描述、心理分析、应对策略等维度展开多角度剖析。
- 语言风格:保持专业性和通俗性平衡,关键理论突出解释,专业术语配合括号解释,段落间逻辑清晰。
- 论证方式:采用经典心理学理论框架,注重理论与实践结合,避免过度 简化或夸大。
- 输出格式:采用合理长短句结构,不需要有数字分段。

## 限制
- 所生成的内容需符合逻辑,准确传达心理知识。
- 严禁使用未经科学验证的心理理论。
- 字数控制在200字左右。
- 直接输出文章正文。
- 文章内禁止出现括注。

用户提示词:

将变量"title"作为参数,填入用户提示词中,如下所示:{{title}}

关于在用户提示词区域,输入用户提示词和变量的设置方式,需要参考《Coze官方文档-在用户提示词区域,输入用户提示词》部分。

5、变量聚合

入参是一个分组(GroupInput),接收2个输入参数,一个是"wenan",另一个是参数"标题",返回参数(group)。

6、数据格式处理

对输入文案内容,进行格式化处理。

处理函数脚本:

javascript 复制代码
// 在这里,您可以通过'params' 获取节点中的输入变量,并通过 'ret' 输出结果
// 'params' 和 'ret' 已经被正确地注入到环境中
// 下面是一个示例,获取节点输入中参数名为'input'的值:
// const input = params.input; 
// 下面是一个示例,输出一个包含多种数据类型的 'ret' 对象:
// const ret = { "name": '小明', "hobbies": ["看书", "旅游"] };
async function main({ params }: Args): Promise<Output> {
    // 获取输入内容
    const inputText = params.input || '';
    
    // 1. 合并连续的换行符为一个
    const mergedNewlines = inputText.replace(/[\n\r]+/g, '\n');
    
    // 2. 仅替换单独的换行符(即前后不是换行符的)
    // 使用负向后行断言和负向前瞻断言
    const formattedText = mergedNewlines.replace(/(?<!\n)\n(?!\n)/g, ',');
    
    // 构建输出对象
    const ret = {
        "formattedText": formattedText
    };

    return ret;
}

7、根据音色和文本合成音频

这里选择"根据音色和文本合成音频"插件,在扣字空间可搜索。

插件详情:https://www.coze.cn/store/plugin/7434029840719839284

8、根据视频的语音来生成字幕

这里使用扣子官方提供的"字幕获取"插件。详情查看:https://www.coze.cn/store/plugin/7403655462140264486

9、文案文本转化

把文案转化

处理函数脚本:

javascript 复制代码
async function main({ params }: Args): Promise<Output> {
    // 确认输入参数为数组,且包含正确结构的对象
    const contentChunks = params.text || [];
    
    // 提取所有 text 值,确保处理正确的字段名
    const textArray = contentChunks.map(chunk => chunk.text).join('||');

    return {
        "wenan": textArray
    };
}

10、分割字幕生成字幕提示词

系统提示词:

md 复制代码
# 角色
你是一位资深且专业的像素风格视频分镜描述专家,在心理学领域有着深厚的知识积累,同时具备极为丰富的视频分镜创作经验。你擅长从独特且富有洞察力的视角,将心理学科普文章转化为生动、新颖且极具创意的视频分镜描述,能够精准无误地剖析文章内容,并为每个字幕文案匹配高度关联的分镜图像提示词。

## 技能
### 技能 1: 制作心理学视频分镜描述
1. 接收用户提供的心理学科普文章内容后,严格按照"||"对文章进行切分,每一段切分后的内容直接作为一个字幕文案,严禁进行提炼或者简化操作。
3. 针对每个字幕文案,充分发挥你的创意和专业素养,创作出与之紧密相关的分镜图像提示词。
4. 画面限定为像素艺术,二次元,动漫风格,忧郁风,
。
6. 最终以 Array Object 格式输出:
[
{
"cap":"对应字幕文案",
"tsc":"分镜图像提示词"
},...
]


## 示例
输出数组示例:
[
  {
 "cap":"有些男人对女人不好,甚至还打她骂她,但女人却仍然爱他,对他不离不弃,这又是怎么回事呢?",
"tsc":"用于AI生图的提示词": "像素风格阴雨街道,男主背对镜头站在斑驳的电话亭旁,右手夹着燃烧的香烟(烟灰低落),青烟混着雨雾缭绕。女主蜷缩在街角路灯下,双臂抱膝低头啜泣,男主的影子通过水洼延伸至她脚边。远处公寓楼窗户透出零星暖光,整体色调冷蓝灰,"
  },....
]
## 限制
- 严格按照"||"来对文案进行切分,来生成文案字幕和分镜图像提示词。禁止私自添加或者减少文案和分镜图片提示词
- 分镜图像提示词必须与对应字幕文案高度紧密相关,字幕文案必须是对用户提供的心理学科普文章切分后的原始内容。
- 输出内容需严格按照指定的 Array Object 格式呈现,杜绝出现格式错误或偏离结构的情况。

用户提示词:

md 复制代码
{{input}}

输出结果:

使用json格式对象数组。

到这里就准备的差不多了,接下来就是图生视频和生成剪映视频草稿的流程,后续步骤可以查看《Coze工作流实战系列》

调试

接下来,选择"试运行",运行后,会生成一个剪映草稿链接。

下载草稿

1、下载剪映小助手

下载地址:https://krxc4izye0.feishu.cn/wiki/SPgzwSCYyicTu8kw86hcgwaNnpg

这个软件需要登录才能够使用哦,但不用付费。

在下载草稿之前,需要先在客户端软件上配置剪映的草稿箱目录。

2、下载草稿

这样一个草稿就下载完成了,包括里面的素材。

用剪映打开草稿

打开剪映专业版,可以看到草稿里面多了一个我们刚才制作好并下载的草稿。

双击它,打开即可。

如果要从剪映导出成视频文件,直接点击右上角的导出按钮即可。

结语

AI工作流适用于解决一些复杂问题。

这对于不会写程序的人来说,是一个可以落地的工具。

2025年,很多企业已经开始推送AI的落地应用,比如构建智能体,构建AI应用等。

当然,AI工作流还有很长的路要走,但已经可以解决很多问题了。

参考