2026 年做短视频,这 5 个 AI 技能插件我把每个都跑通了

2026 年做短视频,这 5 个 AI 技能插件我把每个都跑通了

真实使用后的筛选结果,附安装教程。


01 / 为什么不再一个个换工具了

我做短视频快三年,选题、文案、素材、剪辑,每个环节都试过用 AI 替代。

早期体验很差------A 工具写文案、B 工具扒字幕、C 工具剪视频、D 工具加特效,一条片子做下来要在五六款软件之间反复横跳。不仅没提速,反而因为反复切换上下文,比纯手工还累。

后来接触到 Agent Skills 这个概念,思路才彻底打开。

简单说,Skills 就是一份交给 AI 的"岗位说明书"。装上之后,你用大白话下指令,AI 自动按预设流程跑完所有步骤。主流平台基本都支持------Claude Code、OpenClaw、Cursor、Windsurf、Codex CLI 都可以装。

过去两个月我陆续试了二十多个 Skills,最终筛出 5 个真正能稳定出活的。按创作流程从前到后排列,覆盖了一条短视频从零到成片的完整链路。


02 / 写文案:seo-content-writer

作者 Aaron He Zhu | 平台 ClawHub 适合 选题策划、长文撰写、小红书种草笔记批量出稿

写文案最耗时的从来不是动笔,而是动笔前的调研------关键词怎么定、竞品写了什么、标题怎么取才有流量。这些事单拎出来都不难,但叠加在一起就是一下午。

这个 Skill 把调研全流程封装成了自动化的流水线。告诉它主题和目标平台,它会自动跑:锁定核心词和长尾词 → 分析搜索结果前十页的内容缺口 → 按 H1-H2-H3 搭骨架 → 保证关键信息出现在前 150 字 → 每 500 字穿插外部引用 → 最终输出带摘要的完整成稿。

我个人的两个高频用法:一是公众号行业分析长文,直接出初稿再做精修,效率提升三倍不止;二是小红书种草笔记批量生产,它会自动适配平台语言风格,不用我逐条改语气。


03 / 扒素材:bibigpt-skill

作者 JimmyLv(BibiGPT 创始人)| 平台 GitHub 适合 竞品拆解、播客笔记、素材视频转文字稿

做内容创作,研究同行爆款是日常操作。但手动拉一条一小时的视频做笔记,半个下午就没了。市面上大部分字幕提取工具只认 YouTube,B 站、抖音、小红书基本瘫痪。

这个 Skill 解决的核心痛点就是跨平台内容提取。底层做了针对各平台的字幕抓取适配,覆盖弹幕、CC 字幕、AI 生成字幕三种来源,支持超过 30 个平台------B 站、抖音、小红书、YouTube、小宇宙播客全部在内,本地 MP3 和 MP4 文件也能直接处理。

用法极简:装好之后把视频链接丢给 AI,说一句"帮我总结",几十秒返回带时间戳的结构化摘要。需要英文输出加 --lang en,只要摘要加 --summary-only,按章节切分加 --chapters

我的日常用法:拆解同行的爆款解说结构、整理行业播客为知识笔记、把客户素材快速转成可编辑文字稿。以前一周的工作量,现在一个下午搞定。


04 / 做解说:narrator-ai-cli-skill

作者 AI解说大师 | 平台 GitHub 适合 电影解说、短剧解说、动漫解说的全自动成片

做电影解说视频,传统流程有八步:找片源 → 拉片 → 写文案 → 录配音或 TTS → 找 BGM → 画面匹配剪辑 → 合成 → 加字幕。熟练工一条片子也要三四小时。

这个 Skill 配合它的 CLI 工具,把这八步全部打包成 AI 可调用的模块。你只需要说一句话,比如"帮我做一条飞驰人生的电影解说,喜剧风格",AI 会按顺序自动执行:搜索片源 → 选模板 → 匹配 BGM → 挑配音角色 → 生成文案 → 合成视频 → 返回下载链接。

内置资源量不小:93 部电影素材、146 首 BGM、63 个配音角色、90 多种解说风格模板,主流的短视频解说玩法基本全覆盖。

需要注意两点:一是要同时安装配套的 narrator-ai-cli 命令行工具(一行 pip 命令),CLI 是执行层,Skill 是指挥层,缺一不可;二是使用前需要配置 API Key,README 里有申请方式。

特别适合两类人:已经在做解说账号想大幅提升产能的,以及想入行但被剪辑门槛拦住的新手。


05 / 代码出片:remotion-best-practices

作者 Remotion 官方团队 | 平台 GitHub 适合 知识科普、数据可视化、模板化视频批量生产

Remotion 是用 React 写视频的开源框架,代码直接渲染成 MP4。官方 Skill 包含 30 多份规范文档,覆盖动画、音频、字幕、3D、图表、转场、Lottie、字体加载、TikTok 字幕特效等几乎全部制作环节。

实际操作举一个例子。你对 AI 说:"做一条 30 秒 1080×1920 的教育视频,讲 AI Agent 怎么工作,分 5 个场景,文字安全区距顶 150px、距底 170px,主标题 56px 起。" AI 会自动调研主题 → 写分镜脚本 → 逐场景生成动画代码 → 打开预览让你确认。全程不用写一行代码。

关键优势是确定性输出。改的是代码,不是随机重生成。你说"柱状图加宽""字号调大""配色换橙色",每次修改都精确可控、可复现。

我主要用它做知识科普的批量出片------同一模板套不同数据和文案,一晚上能跑几十条质量稳定的成片。


06 / HTML 出片:HyperFrames

作者 HeyGen | 平台 GitHub 适合 用 AI Agent 直接创作视频、模板批量渲染、可视化出片

这是 2026 年 4 月中旬刚开源的新项目,两天内 GitHub 星标突破 5,000。和 Remotion 同属"用代码做视频"路线,但走了完全不同的技术路径。

HyperFrames 的逻辑非常直白:写 HTML,渲染 MP4 。视频构图就是带几个 data-* 属性的普通 HTML------data-start 控制出场时间,data-duration 控制持续时间,data-track-index 控制轨道层级。不依赖 React,不学任何新语法,会写 HTML 就能上手。

选择 HTML 而非 React 有一个很实际的原因:LLM 训练数据中 HTML 的体量远大于 React,AI Agent 生成 HTML 的准确率和稳定性天然更高。这是 HeyGen 工程师 Joshua Xu 在技术选型时明确提到的考量。

CLI 默认非交互模式,专为 AI Agent 设计------没有确认弹窗、没有向导流程,Agent 可以直接调用渲染命令。项目还内置了 Skills 系统,在 Claude Code 中注册为 /hyperframes/hyperframes-cli/gsap 三个斜杠命令,装好之后 Agent 就能帮你写构图、加动画、配转场。

组件目录提供了 50+ 即用区块:社交平台叠加层、WebGL shader 转场、动态图表、电影特效,一行命令安装。

复制代码
npx hyperframes add flash-through-white   # shader 转场
npx hyperframes add instagram-follow      # 社交叠加层
npx hyperframes add data-chart            # 动态图表

渲染是确定性的------相同输入永远相同输出。跟 AI 说"标题放大""换深色模式""末尾加淡出",改的是代码,每次调整精确可控。

HyperFrames vs Remotion 怎么选? 如果你已经深度使用 React,Remotion 的生态更成熟;如果你主要靠 AI Agent 驱动创作,HyperFrames 的 HTML 路线对 Agent 更友好,上手门槛也更低。两者不存在替代关系,更多是互补。

当前版本 v0.4.6,Apache 2.0 开源,要求 Node.js >= 22 和 FFmpeg。

GitHub 地址:github.com/heygen-com/hyperframes


07 / 安装方式汇总

各平台的安装路径略有差异,统一列在这里:

Claude Code

复制代码
npx skills add <仓库名>

例如:npx skills add heygen-com/hyperframes

OpenClaw(小龙虾)

复制代码
npx clawhub@latest install <skill-名称>

也可以直接在 ClawHub.ai 搜索安装,或手动放到 ~/.openclaw/skills/ 目录。

Cursor / Windsurf / Cline

与 Claude Code 相同,使用 npx skills add 命令。

Codex CLI

使用 codex skill install 命令。

WorkBuddy / QClaw(腾讯系)

在 Agent 的技能管理界面上传 SKILL.md 文件即可。

最省事的方式:把 Skill 的 GitHub 链接发给你的 AI Agent,跟它说"帮我装这个 Skill",大部分 Agent 能自己完成配置。


08 / 最后说几句

几点个人体会。

别贪多。 我一开始装了二十多个,真正每天在用的就这几个。从最痛的环节开始,跑通一个再装下一个。

装之前看源码。 社区 Skills 质量参差不齐,优先选有官方背景或作者信誉好的项目。

Skills 擅长的是流程化、可重复的工作。 创意判断、审美把控、情感表达这些,暂时还是人来做得更好。流水线交给 AI,创意留给自己,这个分工比较合理。


5 个 Skill 的 GitHub 地址汇总:

  • aaron-he-zhu/seo-content-writer
  • JimmyLv/bibigpt-skill
  • jieshuo-ai/narrator-ai-cli-skill
  • remotion-dev/skills
  • heygen-com/hyperframes

本文由mdnice多平台发布

相关推荐
j_xxx404_2 小时前
用系统调用从零封装一个C语言标准I/O库 | 附源码
linux·c语言·开发语言·后端
覆东流2 小时前
第4天:Python输入与输出
后端·python·photoshop·输入与输出
倒霉蛋小马2 小时前
SpringBoot3中配置Knife4j
java·spring boot·后端
我叫黑大帅3 小时前
从零实现一个完整 RAG 系统:基于 Eino 框架的检索增强生成实战
后端·面试·go
NotFound4863 小时前
实战分享怎样实现Spring Boot 中基于 WebClient 的 SSE 流式接口操作
java·spring boot·后端
码事漫谈11 小时前
大模型输出的“隐性结构塌缩”问题及对策
前端·后端
小江的记录本11 小时前
【网络安全】《网络安全常见攻击与防御》(附:《六大攻击核心特性横向对比表》)
java·网络·人工智能·后端·python·安全·web安全
努力的小雨12 小时前
龙虾量化实战法(QClaw)
后端
橙露12 小时前
SpringBoot 整合 MinIO:分布式文件存储上传下载
spring boot·分布式·后端