很多粉丝加了我微信,第一件事情都是问:一人公司怎么玩? 龙虾怎么玩? AI 助理怎么搭?
我的回答都是劝退:龙虾目前是技术极客的玩具,普通人能安装但很难维护,随便出点问题就卡住了!
但现在,我要收回我的说法了,因为 WorkBuddy 出现了。
大家好,我是小虎。

这周,我用 WorkBuddy 做了一件事:上传一份脚本文件,说了一句话,它帮我生成了一个多角色配音、有字幕、有情绪起伏的正式视频。
我啥都没干,去泡了杯茶,回来视频在那里。
普通人被卡在哪里了
在说 WorkBuddy 能做什么之前,我想先说一件真实发生的事。
有一个粉丝,在我的 AI 培训班上认认真真学完了全程。
结课的时候他说:小虎老师,我觉得我学懂了,但回去之后还是不知道从哪里开始用。
这不是个例。这是我在杭州、温州、嘉兴、义乌、安徽望江跑了那么多场培训下来,见到最多的情况。
大家不是不努力,是被卡在了一个地方:工具和需求之间,有一道"怎么操作"的墙。
以前的 AI 工具,你要会写提示词,要懂工作流,要搞清楚 API,要知道各种参数的意思------每一步都是门槛,每一步都可能卡住。
最懂编程的人用起来最顺,不懂技术的人只能干看着。
这就是为什么我之前说龙虾是技术极客的玩具。它很强,但门槛在那里。
WorkBuddy 做的事情,是把这道墙拆了。
它是什么:一句话描述,它帮你做完
WorkBuddy 是腾讯出的桌面 AI 智能体工作台。
这个定义听起来还是有点绕,我用大白话说:你告诉它你要什么,它自己想好怎么做,然后帮你做完,最后把结果交给你。
不是告诉你怎么做,是替你做。
这是和所有传统 AI 对话工具最根本的区别。
你问 ChatGPT"如何做一个视频",它会给你一份步骤列表,然后你按步骤自己去做;
你告诉 WorkBuddy"根据这份脚本帮我做一个视频,要有多角色配音、字幕、情绪起伏",它会自主规划------读脚本、分角色、配音、生成视频帧、合并输出------然后把视频文件交到你手上。
中间没有你的参与。你只需要说清楚你要什么。
我亲测:一句话 + 一份文档,生出一个视频
来说说这次的真实背景。
3 月 27 日到 29 日,在余姚有一场 120 人的狮子会队长培训,我是本次培训的总讲师。
培训前两天,负责《激励会员》这门课的董讲师找到我,说手上有一份角色对话脚本------李斯、马雅、斌斌三个角色,内容是用来激励会员的情景对话。
她问我:能不能用 AI 把这个脚本做成一个视频,在课上播放?
以前遇到这个需求,我的第一反应是:难。
流程是这样的:
- 找配音演员,或者自己录------一个人配三个角色,声音根本区分不了
- 手动对齐字幕------至少 30 分钟
- 做视频画面------再找剪辑工具
- 合成导出
保守估计半天,还得会视频剪辑,还得有点审美。
这次我没找剪辑师,没找配音,也没去学剪辑软件。
我打开了 WorkBuddy。
这次,我只干了一件事:
把董讲师的脚本文件拖进 WorkBuddy,输入一句话:
根据脚本的对话,做一个视频,横版 19:6,要求每个角色的声音不同,但每个角色的声音保持一致,而且根据语境有音调的高低起伏,能听出情绪,有角色对话的声音,有对应的字幕,时间根据剧情的演绎来,演绎完了视频截止。

然后点发送,我去倒了杯茶。
WorkBuddy 开始自己干活:
- 脚本是旧格式的
.doc文件,它读不了,自己想办法用 COM 接口调 Word 程序转换,没有要我换格式 - 识别出三个角色:李斯、马雅、斌斌
- 分析每段对话的情绪,给每个角色分配了声音,语调根据情绪高低起伏
- 按 19:6 横版比例生成视频帧,字幕自动同步
- 写了一个 400 行的视频生成脚本并执行
我能看到它的任务清单在实时更新:
- ✅ 解析脚本内容,结构化对话数据
- ✅ 用 edge-tts 生成每段对话音频(3 个角色各用不同声音)
- ✅ 生成视频帧画面(19:6 比例背景+字幕)
- ⏳ 合并音频和视频帧,输出最终视频
全程不到 20 分钟,我自己操作的时间:不超过 3 分钟。
做完之后我还加了一句:"能够设计狮友的形象吗?有些穿紫色会服,有些穿黄色服务马甲,然后放到场景中去,保持人物一致性。"

WorkBuddy 回:小虎,这个想法很棒!然后给我列了三个风格选项------卡通插画、写实半写实、简笔线条人物,让我选。
这就是 WorkBuddy 的逻辑:你说要什么,它就去做;你说继续加,它接着做。你全程不需要懂任何技术。
我们来看看最终的效果:
(略,掘金文章不支持上传视频)
它还能做什么:普通人最常用的 5 类任务
教学视频只是一个例子。
我用下来,WorkBuddy 真正解放普通人的,是这五类场景:
① 文档生成 工作报告、培训讲义、活动方案、项目提案------你说需求,它生成完整文档,格式、结构、内容全包。以前要花几小时的东西,现在 15 分钟交差。
② 数据分析 把 Excel、CSV 扔进去,说"帮我分析一下这批数据里有什么规律,做成图表"------它自动跑分析,给你图表加解读,不需要你会 Excel 函数。
③ PPT 制作 "根据这份培训方案帮我做一个 20 页的 PPT,风格简洁商务"------它生成完整的演示文稿,有标题有内容有图示。
④ 批量文件处理 "把这个文件夹里的 100 张图片按日期重命名"、"把这些 PDF 里的关键信息提取出来汇总成一个表格"------批量操作,不用你一个一个手动弄。
⑤ 信息整理与报告 "把这段对话记录整理成结构化的会议纪要"、"帮我把这 100 条用户反馈按问题类型分类,找出最集中的 3 个问题"------喂进去,帮你理清楚。
这五类任务有一个共同点:以前要懂工具、懂操作,现在只需要说清楚你要什么。
最关键的用法:让它真正"懂你"
用了一段时间 WorkBuddy 之后,我发现有一个操作差别最大:
大多数人每次用都在重新介绍自己,而真正用得顺的人,让它从一开始就记住了所有背景。
这里有两个文件值得花 20 分钟建一次,以后一直受益:
MEMORY.md------项目记忆文件
在你的工作文件夹里新建一个 MEMORY.md,把你的项目背景写进去:
markdown
# 小虎AI培训项目
## 这是什么
面向中小企业主和AI小白的AI培训内容库
主要产品:线下实战营(2天)+ 公众号内容 + 知识付费
## 目标读者特征
- 40-55岁的中小企业主、个体工商户
- 对AI感兴趣但没有技术背景
- 怕麻烦,需要有人味的实操指导
## 内容风格要求
- 通俗易懂,不用专业术语
- 举例子要贴近日常生活(餐馆、工厂、零售店等场景)
- 结尾要有一个明确的行动指令
## 不要做的事
- 不要写"首先其次最后"这种格式化结构
- 不要用"众所周知"、"毋庸置疑"这类空话
以后每次让 WorkBuddy 处理你的内容,它自动带着这些背景工作,不用你每次重新说一遍。
SOUL.md------助手人设文件
markdown
# 我的AI助手是谁
## 核心原则
- 直接给结论,不废话
- 结果比建议重要,能做的直接做
- 我是AI讲师,面向普通人,内容要接地气
## 工作方式
- 文章加粗控制在全文1%以内
- 标题要有冲击力,不要平淡
- 每篇文章结尾都要有行动指令
这两个文件加起来花 20 分钟写一次,后续每个任务的输出质量会直接上一个台阶。
Skills:一个 WorkBuddy,取代你手机里的 N 个 AI 工具
先问你一个问题:你手机里现在装了多少个 AI 工具?
我统计过自己的:
- 写作、写文章 → 豆包、Kimi
- 画图、配图 → 豆包、即梦
- 音频配音 → MiniMax
- 做 PPT → Gamma、智谱 Z.AI
- 生成视频 → 即梦、通义
6 个场景,7、8 个 App,每次用之前先想半天:这个活该用哪个工具来做?
切来切去,账号要登录,界面要重新熟悉,文件要导来导去------光工具切换本身,就已经消耗掉了你一半的注意力。
WorkBuddy 把这个问题彻底解决了,靠的就是 Skills。
需要写作?加一个写作 Skill。
需要画图?加一个画图 Skill。
需要做 PPT?加一个 PPT 制作 Skill。
需要读文档、分析表格?加一个文档阅读 Skill。
需要生成视频?就像上面那个案例------直接说需求,它自己搞定。
同一个对话框,同一个工具,加载不同的 Skill,它就能做不同的事。
你不需要在七八个 App 之间来回跳,不需要记住每个工具的操作路径,不需要重新介绍你是谁、你要什么风格。
WorkBuddy 还有一个"专家"入口,里面有 100 多个不同领域的专家可以直接调用。
比如你要做的是 AI 教育内容,可以找一个"教育内容设计"专家;
你要写公众号,可以找一个"新媒体写作"专家;
你要整理数据,可以找一个"数据分析"专家。
这些专家不是摆设,它们内置了那个领域的专业知识和操作规范。
你用普通模式问 AI,它按通用逻辑回答;你用对应的专家模式,它按那个领域的专家逻辑回答。
输出的质量和专业度差很多。
它和以前那些工具,到底差在哪里
我知道有人会问:ChatGPT 不也能做这些吗?
区别就在这里:
ChatGPT 等对话 AI:给你建议,告诉你怎么做,最后还是你来执行。
WorkBuddy:接受你的任务,自己规划,自己执行,把成品交给你。
这不是提示词写得好不好的问题,这是工具的本质差异。
就像你请一个秘书和你问一个顾问的区别:顾问告诉你方向,秘书替你做完。
对于普通人来说,这个区别是决定性的------你不需要学会怎么用,你只需要说清楚你要什么。
这就是为什么我之前劝退,现在要收回来。
写在最后
做了 AI 博主,我见过太多人因为技术门槛放弃了 AI。
他们不是不努力,不是不想学,是每一步都在被"不知道怎么操作"卡住。
WorkBuddy 把这道墙拆了。
你不需要懂代码,不需要学提示词工程,不需要搭什么服务器------你只需要把你要做的事情说清楚,它帮你做完。
这才是 AI 普惠应该有的样子。
今天就去试一试:打开 WorkBuddy,把你最想做但一直没做的那件事说出来。你会发现,它比你想象的简单得多。