WorkBuddy:普通人的 AI 门槛,被它彻底抹平了

很多粉丝加了我微信,第一件事情都是问:一人公司怎么玩? 龙虾怎么玩? AI 助理怎么搭?

我的回答都是劝退:龙虾目前是技术极客的玩具,普通人能安装但很难维护,随便出点问题就卡住了!

但现在,我要收回我的说法了,因为 WorkBuddy 出现了。

大家好,我是小虎。

这周,我用 WorkBuddy 做了一件事:上传一份脚本文件,说了一句话,它帮我生成了一个多角色配音、有字幕、有情绪起伏的正式视频

我啥都没干,去泡了杯茶,回来视频在那里。


普通人被卡在哪里了

在说 WorkBuddy 能做什么之前,我想先说一件真实发生的事。

有一个粉丝,在我的 AI 培训班上认认真真学完了全程。

结课的时候他说:小虎老师,我觉得我学懂了,但回去之后还是不知道从哪里开始用。

这不是个例。这是我在杭州、温州、嘉兴、义乌、安徽望江跑了那么多场培训下来,见到最多的情况。

大家不是不努力,是被卡在了一个地方:工具和需求之间,有一道"怎么操作"的墙。

以前的 AI 工具,你要会写提示词,要懂工作流,要搞清楚 API,要知道各种参数的意思------每一步都是门槛,每一步都可能卡住。

最懂编程的人用起来最顺,不懂技术的人只能干看着。

这就是为什么我之前说龙虾是技术极客的玩具。它很强,但门槛在那里。

WorkBuddy 做的事情,是把这道墙拆了。


它是什么:一句话描述,它帮你做完

WorkBuddy 是腾讯出的桌面 AI 智能体工作台。

这个定义听起来还是有点绕,我用大白话说:你告诉它你要什么,它自己想好怎么做,然后帮你做完,最后把结果交给你。

不是告诉你怎么做,是替你做。

这是和所有传统 AI 对话工具最根本的区别。

你问 ChatGPT"如何做一个视频",它会给你一份步骤列表,然后你按步骤自己去做;

你告诉 WorkBuddy"根据这份脚本帮我做一个视频,要有多角色配音、字幕、情绪起伏",它会自主规划------读脚本、分角色、配音、生成视频帧、合并输出------然后把视频文件交到你手上。

中间没有你的参与。你只需要说清楚你要什么。


我亲测:一句话 + 一份文档,生出一个视频

来说说这次的真实背景。

3 月 27 日到 29 日,在余姚有一场 120 人的狮子会队长培训,我是本次培训的总讲师。

培训前两天,负责《激励会员》这门课的董讲师找到我,说手上有一份角色对话脚本------李斯、马雅、斌斌三个角色,内容是用来激励会员的情景对话。

她问我:能不能用 AI 把这个脚本做成一个视频,在课上播放?

以前遇到这个需求,我的第一反应是:难。

流程是这样的:

  1. 找配音演员,或者自己录------一个人配三个角色,声音根本区分不了
  2. 手动对齐字幕------至少 30 分钟
  3. 做视频画面------再找剪辑工具
  4. 合成导出

保守估计半天,还得会视频剪辑,还得有点审美。

这次我没找剪辑师,没找配音,也没去学剪辑软件。

我打开了 WorkBuddy。

这次,我只干了一件事:

把董讲师的脚本文件拖进 WorkBuddy,输入一句话:

根据脚本的对话,做一个视频,横版 19:6,要求每个角色的声音不同,但每个角色的声音保持一致,而且根据语境有音调的高低起伏,能听出情绪,有角色对话的声音,有对应的字幕,时间根据剧情的演绎来,演绎完了视频截止。

然后点发送,我去倒了杯茶。

WorkBuddy 开始自己干活:

  • 脚本是旧格式的 .doc 文件,它读不了,自己想办法用 COM 接口调 Word 程序转换,没有要我换格式
  • 识别出三个角色:李斯、马雅、斌斌
  • 分析每段对话的情绪,给每个角色分配了声音,语调根据情绪高低起伏
  • 按 19:6 横版比例生成视频帧,字幕自动同步
  • 写了一个 400 行的视频生成脚本并执行

我能看到它的任务清单在实时更新:

  • ✅ 解析脚本内容,结构化对话数据
  • ✅ 用 edge-tts 生成每段对话音频(3 个角色各用不同声音)
  • ✅ 生成视频帧画面(19:6 比例背景+字幕)
  • ⏳ 合并音频和视频帧,输出最终视频

全程不到 20 分钟,我自己操作的时间:不超过 3 分钟。

做完之后我还加了一句:"能够设计狮友的形象吗?有些穿紫色会服,有些穿黄色服务马甲,然后放到场景中去,保持人物一致性。"

WorkBuddy 回:小虎,这个想法很棒!然后给我列了三个风格选项------卡通插画、写实半写实、简笔线条人物,让我选。

这就是 WorkBuddy 的逻辑:你说要什么,它就去做;你说继续加,它接着做。你全程不需要懂任何技术。

我们来看看最终的效果:

(略,掘金文章不支持上传视频)


它还能做什么:普通人最常用的 5 类任务

教学视频只是一个例子。

我用下来,WorkBuddy 真正解放普通人的,是这五类场景:

① 文档生成 工作报告、培训讲义、活动方案、项目提案------你说需求,它生成完整文档,格式、结构、内容全包。以前要花几小时的东西,现在 15 分钟交差。

数据分析 把 Excel、CSV 扔进去,说"帮我分析一下这批数据里有什么规律,做成图表"------它自动跑分析,给你图表加解读,不需要你会 Excel 函数。

③ PPT 制作 "根据这份培训方案帮我做一个 20 页的 PPT,风格简洁商务"------它生成完整的演示文稿,有标题有内容有图示。

④ 批量文件处理 "把这个文件夹里的 100 张图片按日期重命名"、"把这些 PDF 里的关键信息提取出来汇总成一个表格"------批量操作,不用你一个一个手动弄。

⑤ 信息整理与报告 "把这段对话记录整理成结构化的会议纪要"、"帮我把这 100 条用户反馈按问题类型分类,找出最集中的 3 个问题"------喂进去,帮你理清楚。

这五类任务有一个共同点:以前要懂工具、懂操作,现在只需要说清楚你要什么。


最关键的用法:让它真正"懂你"

用了一段时间 WorkBuddy 之后,我发现有一个操作差别最大:

大多数人每次用都在重新介绍自己,而真正用得顺的人,让它从一开始就记住了所有背景。

这里有两个文件值得花 20 分钟建一次,以后一直受益:

MEMORY.md------项目记忆文件

在你的工作文件夹里新建一个 MEMORY.md,把你的项目背景写进去:

markdown 复制代码
# 小虎AI培训项目

## 这是什么
面向中小企业主和AI小白的AI培训内容库
主要产品:线下实战营(2天)+ 公众号内容 + 知识付费

## 目标读者特征
- 40-55岁的中小企业主、个体工商户
- 对AI感兴趣但没有技术背景
- 怕麻烦,需要有人味的实操指导

## 内容风格要求
- 通俗易懂,不用专业术语
- 举例子要贴近日常生活(餐馆、工厂、零售店等场景)
- 结尾要有一个明确的行动指令

## 不要做的事
- 不要写"首先其次最后"这种格式化结构
- 不要用"众所周知"、"毋庸置疑"这类空话

以后每次让 WorkBuddy 处理你的内容,它自动带着这些背景工作,不用你每次重新说一遍。

SOUL.md------助手人设文件

markdown 复制代码
# 我的AI助手是谁

## 核心原则
- 直接给结论,不废话
- 结果比建议重要,能做的直接做
- 我是AI讲师,面向普通人,内容要接地气

## 工作方式
- 文章加粗控制在全文1%以内
- 标题要有冲击力,不要平淡
- 每篇文章结尾都要有行动指令

这两个文件加起来花 20 分钟写一次,后续每个任务的输出质量会直接上一个台阶。


Skills:一个 WorkBuddy,取代你手机里的 N 个 AI 工具

先问你一个问题:你手机里现在装了多少个 AI 工具?

我统计过自己的:

  • 写作、写文章 → 豆包、Kimi
  • 画图、配图 → 豆包、即梦
  • 音频配音 → MiniMax
  • 做 PPT → Gamma、智谱 Z.AI
  • 生成视频 → 即梦、通义

6 个场景,7、8 个 App,每次用之前先想半天:这个活该用哪个工具来做?

切来切去,账号要登录,界面要重新熟悉,文件要导来导去------光工具切换本身,就已经消耗掉了你一半的注意力。

WorkBuddy 把这个问题彻底解决了,靠的就是 Skills。

需要写作?加一个写作 Skill。

需要画图?加一个画图 Skill。

需要做 PPT?加一个 PPT 制作 Skill。

需要读文档、分析表格?加一个文档阅读 Skill。

需要生成视频?就像上面那个案例------直接说需求,它自己搞定。

同一个对话框,同一个工具,加载不同的 Skill,它就能做不同的事。

你不需要在七八个 App 之间来回跳,不需要记住每个工具的操作路径,不需要重新介绍你是谁、你要什么风格。


WorkBuddy 还有一个"专家"入口,里面有 100 多个不同领域的专家可以直接调用。

比如你要做的是 AI 教育内容,可以找一个"教育内容设计"专家;

你要写公众号,可以找一个"新媒体写作"专家;

你要整理数据,可以找一个"数据分析"专家。

这些专家不是摆设,它们内置了那个领域的专业知识和操作规范。

你用普通模式问 AI,它按通用逻辑回答;你用对应的专家模式,它按那个领域的专家逻辑回答。

输出的质量和专业度差很多。


它和以前那些工具,到底差在哪里

我知道有人会问:ChatGPT 不也能做这些吗?

区别就在这里:

ChatGPT 等对话 AI:给你建议,告诉你怎么做,最后还是你来执行。

WorkBuddy:接受你的任务,自己规划,自己执行,把成品交给你。

这不是提示词写得好不好的问题,这是工具的本质差异。

就像你请一个秘书和你问一个顾问的区别:顾问告诉你方向,秘书替你做完。

对于普通人来说,这个区别是决定性的------你不需要学会怎么用,你只需要说清楚你要什么。

这就是为什么我之前劝退,现在要收回来。


写在最后

做了 AI 博主,我见过太多人因为技术门槛放弃了 AI。

他们不是不努力,不是不想学,是每一步都在被"不知道怎么操作"卡住。

WorkBuddy 把这道墙拆了。

你不需要懂代码,不需要学提示词工程,不需要搭什么服务器------你只需要把你要做的事情说清楚,它帮你做完。

这才是 AI 普惠应该有的样子。

今天就去试一试:打开 WorkBuddy,把你最想做但一直没做的那件事说出来。你会发现,它比你想象的简单得多。

相关推荐
lbh3 小时前
从LLM到Agent的核心概念
前端·openai·ai编程
RulerMike3 小时前
three 实现简单机械臂逆运动
前端·ai编程·three.js
数据智能老司机4 小时前
使用 Claude Code 进行 Agentic 编码——Claude Code 规划模式与多智能体工作流
ai编程
多年小白4 小时前
Anthropic发布Mythos模型:为什么网络安全板块先跌为敬
网络·人工智能·科技·ai编程
云起SAAS5 小时前
在线客服系统源码 | 支持PC管理端+H5访客端+实时聊天
微信小程序·ai编程·看广告变现轻·在线客服系统源码
JaydenAI5 小时前
[RAG在LangChain中的实现]根据数据格式选择文档加载器和文本分割器
python·langchain·ai编程
猪哥-嵌入式7 小时前
用Claude Code Skill为大型工程做功能测试:分批处理与摘要归档实战指南
ai编程
想打游戏的程序猿17 小时前
核心概念层——深入理解 Agent 是什么
后端·ai编程
唐骁虎18 小时前
Claude Code 全景架构指南——三大核心支柱及四大关键扩展组件
ai·架构·ai编程·claude code