WorkBuddy：普通人的 AI 门槛，被它彻底抹平了

很多粉丝加了我微信，第一件事情都是问：一人公司怎么玩？龙虾怎么玩？ AI 助理怎么搭？

我的回答都是劝退：龙虾目前是技术极客的玩具，普通人能安装但很难维护，随便出点问题就卡住了！

但现在，我要收回我的说法了，因为 WorkBuddy 出现了。

大家好，我是小虎。

这周，我用 WorkBuddy 做了一件事：上传一份脚本文件，说了一句话，它帮我生成了一个多角色配音、有字幕、有情绪起伏的正式视频。

我啥都没干，去泡了杯茶，回来视频在那里。

普通人被卡在哪里了

在说 WorkBuddy 能做什么之前，我想先说一件真实发生的事。

有一个粉丝，在我的 AI 培训班上认认真真学完了全程。

结课的时候他说：小虎老师，我觉得我学懂了，但回去之后还是不知道从哪里开始用。

这不是个例。这是我在杭州、温州、嘉兴、义乌、安徽望江跑了那么多场培训下来，见到最多的情况。

大家不是不努力，是被卡在了一个地方：工具和需求之间，有一道"怎么操作"的墙。

以前的 AI 工具，你要会写提示词，要懂工作流，要搞清楚 API，要知道各种参数的意思------每一步都是门槛，每一步都可能卡住。

最懂编程的人用起来最顺，不懂技术的人只能干看着。

这就是为什么我之前说龙虾是技术极客的玩具。它很强，但门槛在那里。

WorkBuddy 做的事情，是把这道墙拆了。

它是什么：一句话描述，它帮你做完

WorkBuddy 是腾讯出的桌面 AI 智能体工作台。

这个定义听起来还是有点绕，我用大白话说：你告诉它你要什么，它自己想好怎么做，然后帮你做完，最后把结果交给你。

不是告诉你怎么做，是替你做。

这是和所有传统 AI 对话工具最根本的区别。

你问 ChatGPT"如何做一个视频"，它会给你一份步骤列表，然后你按步骤自己去做；

你告诉 WorkBuddy"根据这份脚本帮我做一个视频，要有多角色配音、字幕、情绪起伏"，它会自主规划------读脚本、分角色、配音、生成视频帧、合并输出------然后把视频文件交到你手上。

中间没有你的参与。你只需要说清楚你要什么。

我亲测：一句话 + 一份文档，生出一个视频

来说说这次的真实背景。

3 月 27 日到 29 日，在余姚有一场 120 人的狮子会队长培训，我是本次培训的总讲师。

培训前两天，负责《激励会员》这门课的董讲师找到我，说手上有一份角色对话脚本------李斯、马雅、斌斌三个角色，内容是用来激励会员的情景对话。

她问我：能不能用 AI 把这个脚本做成一个视频，在课上播放？

以前遇到这个需求，我的第一反应是：难。

流程是这样的：

找配音演员，或者自己录------一个人配三个角色，声音根本区分不了
手动对齐字幕------至少 30 分钟
做视频画面------再找剪辑工具
合成导出

保守估计半天，还得会视频剪辑，还得有点审美。

这次我没找剪辑师，没找配音，也没去学剪辑软件。

我打开了 WorkBuddy。

这次，我只干了一件事：

把董讲师的脚本文件拖进 WorkBuddy，输入一句话：

根据脚本的对话，做一个视频，横版 19:6，要求每个角色的声音不同，但每个角色的声音保持一致，而且根据语境有音调的高低起伏，能听出情绪，有角色对话的声音，有对应的字幕，时间根据剧情的演绎来，演绎完了视频截止。

然后点发送，我去倒了杯茶。

WorkBuddy 开始自己干活：

脚本是旧格式的 .doc 文件，它读不了，自己想办法用 COM 接口调 Word 程序转换，没有要我换格式
识别出三个角色：李斯、马雅、斌斌
分析每段对话的情绪，给每个角色分配了声音，语调根据情绪高低起伏
按 19:6 横版比例生成视频帧，字幕自动同步
写了一个 400 行的视频生成脚本并执行

我能看到它的任务清单在实时更新：

✅ 解析脚本内容，结构化对话数据
✅ 用 edge-tts 生成每段对话音频（3 个角色各用不同声音）
✅ 生成视频帧画面（19:6 比例背景+字幕）
⏳ 合并音频和视频帧，输出最终视频

全程不到 20 分钟，我自己操作的时间：不超过 3 分钟。

做完之后我还加了一句："能够设计狮友的形象吗？有些穿紫色会服，有些穿黄色服务马甲，然后放到场景中去，保持人物一致性。"

WorkBuddy 回：小虎，这个想法很棒！然后给我列了三个风格选项------卡通插画、写实半写实、简笔线条人物，让我选。

这就是 WorkBuddy 的逻辑：你说要什么，它就去做；你说继续加，它接着做。你全程不需要懂任何技术。

我们来看看最终的效果：

（略，掘金文章不支持上传视频）

它还能做什么：普通人最常用的 5 类任务

教学视频只是一个例子。

我用下来，WorkBuddy 真正解放普通人的，是这五类场景：

① 文档生成 工作报告、培训讲义、活动方案、项目提案------你说需求，它生成完整文档，格式、结构、内容全包。以前要花几小时的东西，现在 15 分钟交差。

② 数据分析 把 Excel、CSV 扔进去，说"帮我分析一下这批数据里有什么规律，做成图表"------它自动跑分析，给你图表加解读，不需要你会 Excel 函数。

③ PPT 制作 "根据这份培训方案帮我做一个 20 页的 PPT，风格简洁商务"------它生成完整的演示文稿，有标题有内容有图示。

④ 批量文件处理 "把这个文件夹里的 100 张图片按日期重命名"、"把这些 PDF 里的关键信息提取出来汇总成一个表格"------批量操作，不用你一个一个手动弄。

⑤ 信息整理与报告 "把这段对话记录整理成结构化的会议纪要"、"帮我把这 100 条用户反馈按问题类型分类，找出最集中的 3 个问题"------喂进去，帮你理清楚。

这五类任务有一个共同点：以前要懂工具、懂操作，现在只需要说清楚你要什么。

最关键的用法：让它真正"懂你"

用了一段时间 WorkBuddy 之后，我发现有一个操作差别最大：

大多数人每次用都在重新介绍自己，而真正用得顺的人，让它从一开始就记住了所有背景。

这里有两个文件值得花 20 分钟建一次，以后一直受益：

MEMORY.md------项目记忆文件

在你的工作文件夹里新建一个 MEMORY.md，把你的项目背景写进去：

markdown 复制代码

# 小虎AI培训项目

## 这是什么
面向中小企业主和AI小白的AI培训内容库
主要产品：线下实战营（2天）+ 公众号内容 + 知识付费

## 目标读者特征
- 40-55岁的中小企业主、个体工商户
- 对AI感兴趣但没有技术背景
- 怕麻烦，需要有人味的实操指导

## 内容风格要求
- 通俗易懂，不用专业术语
- 举例子要贴近日常生活（餐馆、工厂、零售店等场景）
- 结尾要有一个明确的行动指令

## 不要做的事
- 不要写"首先其次最后"这种格式化结构
- 不要用"众所周知"、"毋庸置疑"这类空话

以后每次让 WorkBuddy 处理你的内容，它自动带着这些背景工作，不用你每次重新说一遍。

SOUL.md------助手人设文件

markdown 复制代码

# 我的AI助手是谁

## 核心原则
- 直接给结论，不废话
- 结果比建议重要，能做的直接做
- 我是AI讲师，面向普通人，内容要接地气

## 工作方式
- 文章加粗控制在全文1%以内
- 标题要有冲击力，不要平淡
- 每篇文章结尾都要有行动指令

这两个文件加起来花 20 分钟写一次，后续每个任务的输出质量会直接上一个台阶。

Skills：一个 WorkBuddy，取代你手机里的 N 个 AI 工具

先问你一个问题：你手机里现在装了多少个 AI 工具？

我统计过自己的：

写作、写文章 → 豆包、Kimi
画图、配图 → 豆包、即梦
音频配音 → MiniMax
做 PPT → Gamma、智谱 Z.AI
生成视频 → 即梦、通义

6 个场景，7、8 个 App，每次用之前先想半天：这个活该用哪个工具来做？

切来切去，账号要登录，界面要重新熟悉，文件要导来导去------光工具切换本身，就已经消耗掉了你一半的注意力。

WorkBuddy 把这个问题彻底解决了，靠的就是 Skills。

需要写作？加一个写作 Skill。

需要画图？加一个画图 Skill。

需要做 PPT？加一个 PPT 制作 Skill。

需要读文档、分析表格？加一个文档阅读 Skill。

需要生成视频？就像上面那个案例------直接说需求，它自己搞定。

同一个对话框，同一个工具，加载不同的 Skill，它就能做不同的事。

你不需要在七八个 App 之间来回跳，不需要记住每个工具的操作路径，不需要重新介绍你是谁、你要什么风格。

WorkBuddy 还有一个"专家"入口，里面有 100 多个不同领域的专家可以直接调用。

比如你要做的是 AI 教育内容，可以找一个"教育内容设计"专家；

你要写公众号，可以找一个"新媒体写作"专家；

你要整理数据，可以找一个"数据分析"专家。

这些专家不是摆设，它们内置了那个领域的专业知识和操作规范。

你用普通模式问 AI，它按通用逻辑回答；你用对应的专家模式，它按那个领域的专家逻辑回答。

输出的质量和专业度差很多。

它和以前那些工具，到底差在哪里

我知道有人会问：ChatGPT 不也能做这些吗？

区别就在这里：

ChatGPT 等对话 AI：给你建议，告诉你怎么做，最后还是你来执行。

WorkBuddy：接受你的任务，自己规划，自己执行，把成品交给你。

这不是提示词写得好不好的问题，这是工具的本质差异。

就像你请一个秘书和你问一个顾问的区别：顾问告诉你方向，秘书替你做完。

对于普通人来说，这个区别是决定性的------你不需要学会怎么用，你只需要说清楚你要什么。

这就是为什么我之前劝退，现在要收回来。

写在最后

做了 AI 博主，我见过太多人因为技术门槛放弃了 AI。

他们不是不努力，不是不想学，是每一步都在被"不知道怎么操作"卡住。

WorkBuddy 把这道墙拆了。

你不需要懂代码，不需要学提示词工程，不需要搭什么服务器------你只需要把你要做的事情说清楚，它帮你做完。

这才是 AI 普惠应该有的样子。

今天就去试一试：打开 WorkBuddy，把你最想做但一直没做的那件事说出来。你会发现，它比你想象的简单得多。