主要工具:Kling 3.0(主力)、Veo 3.1、Runway Gen-4.5、即梦AI + 自动化工作流(AI Short Video Factory / GitHub开源链路 + OpenClaw skill集成)
主要内容类型:家居装修前后对比、知识卡片、虚拟人物口播带货、情感鸡汤短剧片段、宠物拟人搞笑对话
一、状态感知
-
效率革命:从几天压缩到分钟级
传统短视频制作动辄2-3天。现在用Kling 3.0或Veo 3.1,从一句话提示到完整15-30秒成片,最快5-15分钟。极端案例:用OpenClaw + 视频生成skill,只输入一句话,泡个咖啡回来视频已ready(自带字幕、转场、BGM)。
-
一致性终于过关
Kling 3.0的多镜头叙事+Elements角色锁定,一致率85%以上;Veo 3.1物理模拟真实,做产品展示无缝。
-
真能赚钱,窗口期还在
批量家居前后对比投小红书/抖音,单条转化8.7%,月流水覆盖订阅费。虚拟口播带货token成本<5元/条。

二、踩过的坑
-
单一模型信仰是大忌:Kling叙事丝滑但口播偶尔怪音;Veo物理真实但慢+贵;Runway创意强但一致性弱。最佳混搭:Veo/Kling生成主体,Runway补特效。
-
Prompt写法决定生死:用"导演说戏式"。示例:
"一个25岁亚洲女性,穿白色卫衣,站在现代厨房,表情从疲惫转为惊喜,拿起新款空气炸锅,镜头从广角推到特写手部操作,背景温暖黄光,节奏轻快,配轻电子音乐。"
-
批量生产别手动:必须上自动化链路(GitHub AI Short Video Factory或类似)。
-
审美疲劳+平台限流已来:纯AI缝合怪易反感。解法:AI做60%(特写+转场),补真人解说。
三、核心自动化工作流代码呈现(Python示例)这些是简化版、可直接跑的片段,基于Kling API调用 + 基本链路(文本→脚本→TTS→视频生成→合成)。实际用时需替换你的API Key,并安装requests、moviepy等库。
-
Prompt优化 + 脚本生成(用LLM生成分镜脚本)python
import requests def generate_script_from_idea(idea, api_key): url = "https://api.xxxxxx.com/v1/chat/completions" # 或用Groq/Claude等更快模型 headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"} prompt = f""" 基于主题'{idea}',写一个15-30秒短视频完整脚本: - 第一句强钩子(3秒内) - 分3-5个镜头描述(包含动作、表情、镜头运动) - 结尾CTA - 适合Kling/Veo生成:详细视觉描述 输出格式:JSON列表,每项有"scene": "描述", "duration": 秒数 """ payload = { "model": "gpt-4o-mini", # 或 claude-3.5-sonnet 等 "messages": [{"role": "user", "content": prompt}], "temperature": 0.7 } response = requests.post(url, headers=headers, json=payload).json() return response['choices'][0]['message']['content'] # 返回JSON字符串 -
调用Kling 3.0 API生成视频(Text-to-Video示例)python
import requests import time def generate_kling_video(prompt, api_key): url = "https://api.klingai.com/v1/videos/text2video" # Kling 3.0 API端点(参考官方文档) headers = { "Authorization": f"Bearer {api_key}", "Content-Type": "application/json" } payload = { "model": "kling-v3.0-pro", "prompt": prompt, "duration": 10, # 秒,支持5-60s "aspect_ratio": "9:16", # 竖屏短视频 "quality": "high" } response = requests.post(url, headers=headers, json=payload).json() task_id = response.get("data", {}).get("task_id") # 轮询任务状态(实际可加重试/超时) while True: status_url = f"https://api.klingai.com/v1/tasks/{task_id}" status_resp = requests.get(status_url, headers=headers).json() if status_resp.get("status") == "completed": return status_resp["data"]["video_url"] elif status_resp.get("status") == "failed": raise Exception("Generation failed") time.sleep(10) # 每10秒查一次 -
简单视频合成(用MoviePy加字幕/BGM,批量后处理)python
from moviepy.editor import VideoFileClip, TextClip, concatenate_videoclips, AudioFileClip def add_subtitle_and_bgm(video_path, subtitles, bgm_path, output_path): clip = VideoFileClip(video_path) # 加背景音乐(淡入淡出) bgm = AudioFileClip(bgm_path).volumex(0.4).audio_fadein(1).audio_fadeout(1) final_audio = bgm.overlay(clip.audio) clip = clip.set_audio(final_audio) # 加字幕(逐句) txt_clips = [] for text, start, end in subtitles: # 假设subtitles是列表[(text, start_sec, end_sec)] txt = TextClip(text, fontsize=40, color='white', font='Arial-Bold', stroke_color='black', stroke_width=2) txt = txt.set_position(('center', 'bottom')).set_duration(end - start).set_start(start) txt_clips.append(txt) final = concatenate_videoclips([clip.set_duration(clip.duration)]) # 可扩展多段 for txt in txt_clips: final = final.set_layer(txt) final.write_videofile(output_path, fps=30, codec='libx264')
集成建议:如果用OpenClaw skill封装以上函数(参考Genviral skill或ai-video-gen skill),一句话触发全链路;或用n8n/脚本定时跑批量。

四、当前结论与建议,AI短视频已彻底变成生产力工具。认真变现拼的是工作流自动化 + prompt模板库 + 垂直选题。窗口还在,但半年后极卷。推荐起步路径:
-
熟练Kling 3.0(性价比+多镜头最强)。
-
建prompt模板库(分类保存)。
-
上自动化流水线(以上代码 + OpenClaw)。
-
选1-2领域深耕。
-
混合真人元素防限流。