2026 年做短视频,这 5 个 AI 技能插件我把每个都跑通了

2026 年做短视频,这 5 个 AI 技能插件我把每个都跑通了

真实使用后的筛选结果,附安装教程。


01 / 为什么不再一个个换工具了

我做短视频快三年,选题、文案、素材、剪辑,每个环节都试过用 AI 替代。

早期体验很差------A 工具写文案、B 工具扒字幕、C 工具剪视频、D 工具加特效,一条片子做下来要在五六款软件之间反复横跳。不仅没提速,反而因为反复切换上下文,比纯手工还累。

后来接触到 Agent Skills 这个概念,思路才彻底打开。

简单说,Skills 就是一份交给 AI 的"岗位说明书"。装上之后,你用大白话下指令,AI 自动按预设流程跑完所有步骤。主流平台基本都支持------Claude Code、OpenClaw、Cursor、Windsurf、Codex CLI 都可以装。

过去两个月我陆续试了二十多个 Skills,最终筛出 5 个真正能稳定出活的。按创作流程从前到后排列,覆盖了一条短视频从零到成片的完整链路。


02 / 写文案:seo-content-writer

作者 Aaron He Zhu | 平台 ClawHub 适合 选题策划、长文撰写、小红书种草笔记批量出稿

写文案最耗时的从来不是动笔,而是动笔前的调研------关键词怎么定、竞品写了什么、标题怎么取才有流量。这些事单拎出来都不难,但叠加在一起就是一下午。

这个 Skill 把调研全流程封装成了自动化的流水线。告诉它主题和目标平台,它会自动跑:锁定核心词和长尾词 → 分析搜索结果前十页的内容缺口 → 按 H1-H2-H3 搭骨架 → 保证关键信息出现在前 150 字 → 每 500 字穿插外部引用 → 最终输出带摘要的完整成稿。

我个人的两个高频用法:一是公众号行业分析长文,直接出初稿再做精修,效率提升三倍不止;二是小红书种草笔记批量生产,它会自动适配平台语言风格,不用我逐条改语气。


03 / 扒素材:bibigpt-skill

作者 JimmyLv(BibiGPT 创始人)| 平台 GitHub 适合 竞品拆解、播客笔记、素材视频转文字稿

做内容创作,研究同行爆款是日常操作。但手动拉一条一小时的视频做笔记,半个下午就没了。市面上大部分字幕提取工具只认 YouTube,B 站、抖音、小红书基本瘫痪。

这个 Skill 解决的核心痛点就是跨平台内容提取。底层做了针对各平台的字幕抓取适配,覆盖弹幕、CC 字幕、AI 生成字幕三种来源,支持超过 30 个平台------B 站、抖音、小红书、YouTube、小宇宙播客全部在内,本地 MP3 和 MP4 文件也能直接处理。

用法极简:装好之后把视频链接丢给 AI,说一句"帮我总结",几十秒返回带时间戳的结构化摘要。需要英文输出加 --lang en,只要摘要加 --summary-only,按章节切分加 --chapters

我的日常用法:拆解同行的爆款解说结构、整理行业播客为知识笔记、把客户素材快速转成可编辑文字稿。以前一周的工作量,现在一个下午搞定。


04 / 做解说:narrator-ai-cli-skill

作者 AI解说大师 | 平台 GitHub 适合 电影解说、短剧解说、动漫解说的全自动成片

做电影解说视频,传统流程有八步:找片源 → 拉片 → 写文案 → 录配音或 TTS → 找 BGM → 画面匹配剪辑 → 合成 → 加字幕。熟练工一条片子也要三四小时。

这个 Skill 配合它的 CLI 工具,把这八步全部打包成 AI 可调用的模块。你只需要说一句话,比如"帮我做一条飞驰人生的电影解说,喜剧风格",AI 会按顺序自动执行:搜索片源 → 选模板 → 匹配 BGM → 挑配音角色 → 生成文案 → 合成视频 → 返回下载链接。

内置资源量不小:93 部电影素材、146 首 BGM、63 个配音角色、90 多种解说风格模板,主流的短视频解说玩法基本全覆盖。

需要注意两点:一是要同时安装配套的 narrator-ai-cli 命令行工具(一行 pip 命令),CLI 是执行层,Skill 是指挥层,缺一不可;二是使用前需要配置 API Key,README 里有申请方式。

特别适合两类人:已经在做解说账号想大幅提升产能的,以及想入行但被剪辑门槛拦住的新手。


05 / 代码出片:remotion-best-practices

作者 Remotion 官方团队 | 平台 GitHub 适合 知识科普、数据可视化、模板化视频批量生产

Remotion 是用 React 写视频的开源框架,代码直接渲染成 MP4。官方 Skill 包含 30 多份规范文档,覆盖动画、音频、字幕、3D、图表、转场、Lottie、字体加载、TikTok 字幕特效等几乎全部制作环节。

实际操作举一个例子。你对 AI 说:"做一条 30 秒 1080×1920 的教育视频,讲 AI Agent 怎么工作,分 5 个场景,文字安全区距顶 150px、距底 170px,主标题 56px 起。" AI 会自动调研主题 → 写分镜脚本 → 逐场景生成动画代码 → 打开预览让你确认。全程不用写一行代码。

关键优势是确定性输出。改的是代码,不是随机重生成。你说"柱状图加宽""字号调大""配色换橙色",每次修改都精确可控、可复现。

我主要用它做知识科普的批量出片------同一模板套不同数据和文案,一晚上能跑几十条质量稳定的成片。


06 / HTML 出片:HyperFrames

作者 HeyGen | 平台 GitHub 适合 用 AI Agent 直接创作视频、模板批量渲染、可视化出片

这是 2026 年 4 月中旬刚开源的新项目,两天内 GitHub 星标突破 5,000。和 Remotion 同属"用代码做视频"路线,但走了完全不同的技术路径。

HyperFrames 的逻辑非常直白:写 HTML,渲染 MP4 。视频构图就是带几个 data-* 属性的普通 HTML------data-start 控制出场时间,data-duration 控制持续时间,data-track-index 控制轨道层级。不依赖 React,不学任何新语法,会写 HTML 就能上手。

选择 HTML 而非 React 有一个很实际的原因:LLM 训练数据中 HTML 的体量远大于 React,AI Agent 生成 HTML 的准确率和稳定性天然更高。这是 HeyGen 工程师 Joshua Xu 在技术选型时明确提到的考量。

CLI 默认非交互模式,专为 AI Agent 设计------没有确认弹窗、没有向导流程,Agent 可以直接调用渲染命令。项目还内置了 Skills 系统,在 Claude Code 中注册为 /hyperframes/hyperframes-cli/gsap 三个斜杠命令,装好之后 Agent 就能帮你写构图、加动画、配转场。

组件目录提供了 50+ 即用区块:社交平台叠加层、WebGL shader 转场、动态图表、电影特效,一行命令安装。

复制代码
npx hyperframes add flash-through-white   # shader 转场
npx hyperframes add instagram-follow      # 社交叠加层
npx hyperframes add data-chart            # 动态图表

渲染是确定性的------相同输入永远相同输出。跟 AI 说"标题放大""换深色模式""末尾加淡出",改的是代码,每次调整精确可控。

HyperFrames vs Remotion 怎么选? 如果你已经深度使用 React,Remotion 的生态更成熟;如果你主要靠 AI Agent 驱动创作,HyperFrames 的 HTML 路线对 Agent 更友好,上手门槛也更低。两者不存在替代关系,更多是互补。

当前版本 v0.4.6,Apache 2.0 开源,要求 Node.js >= 22 和 FFmpeg。

GitHub 地址:github.com/heygen-com/hyperframes


07 / 安装方式汇总

各平台的安装路径略有差异,统一列在这里:

Claude Code

复制代码
npx skills add <仓库名>

例如:npx skills add heygen-com/hyperframes

OpenClaw(小龙虾)

复制代码
npx clawhub@latest install <skill-名称>

也可以直接在 ClawHub.ai 搜索安装,或手动放到 ~/.openclaw/skills/ 目录。

Cursor / Windsurf / Cline

与 Claude Code 相同,使用 npx skills add 命令。

Codex CLI

使用 codex skill install 命令。

WorkBuddy / QClaw(腾讯系)

在 Agent 的技能管理界面上传 SKILL.md 文件即可。

最省事的方式:把 Skill 的 GitHub 链接发给你的 AI Agent,跟它说"帮我装这个 Skill",大部分 Agent 能自己完成配置。


08 / 最后说几句

几点个人体会。

别贪多。 我一开始装了二十多个,真正每天在用的就这几个。从最痛的环节开始,跑通一个再装下一个。

装之前看源码。 社区 Skills 质量参差不齐,优先选有官方背景或作者信誉好的项目。

Skills 擅长的是流程化、可重复的工作。 创意判断、审美把控、情感表达这些,暂时还是人来做得更好。流水线交给 AI,创意留给自己,这个分工比较合理。


5 个 Skill 的 GitHub 地址汇总:

  • aaron-he-zhu/seo-content-writer
  • JimmyLv/bibigpt-skill
  • jieshuo-ai/narrator-ai-cli-skill
  • remotion-dev/skills
  • heygen-com/hyperframes

本文由mdnice多平台发布

相关推荐
苏三说技术12 小时前
Claude Code从失控到起飞,只用了这些技巧
后端
长栎13 小时前
写 for 循环写了十年,你却从没用过迭代器模式最狠的那一面
后端
LiaCode13 小时前
Redis 在生产项目的使用
前端·后端
用户5598224812213 小时前
Docker Compose Down 导致容器数据误删——ext4 日志恢复全记录
后端
LiaCode13 小时前
一天学完 redis 的爽翻版核心知识总结
前端·后端
大刚测试开发实战13 小时前
如何内网穿透访问本地私有化部署的TestHub
前端·后端·github
xiaodaoluanzha14 小时前
迄今為止,最簡單的編程語言 Nolang
前端·后端
Csvn14 小时前
Docker 容器管理入门 — 从镜像到容器编排
后端
用户7623524259114 小时前
ShardingJDBC
后端
行者全栈架构师14 小时前
IDEA 中 Maven 项目的 15 个红色报错快速解决方法
java·后端