Manus，没有秘密「注解版」

Florian2025-03-14 23:52

近来Manus走红，「争论」不断，我也在前文《Manus爆火，是硬核还是营销？》中阐述过自Manus发布后，行业讨论以及开源复刻的信息，以及我们如何结合蚂蚁图计算（TuGraph）技术，实践Graph Manus的方法思路。

昨天，明浩老师在他的播客「屠龙之术」发布了「Manus，没有秘密 - 70页PPT解读AI Agent」，分享了AI Agent的定义、Manus实现逻辑等非常有深度的观点，并无私地共享了这份PPT。我个人看完后大呼过瘾，相信Agent建设者也能从中找到诸多共鸣。我这里结合了个人的理解对其做了简单的释义和备注，姑且称之为「注解版」吧，内容实在太好，忍不住向大家及时分享。

1. 核心叙事

「注」：L1代表案例有ChatGPT，Claude等一系列大模型，从文本生成模型到多模态模型。L2代表案例有GPT-o1、DeepSeek-R1等一众推理模型，以及早期的ReAct、CoT、ToT等智能体思维链探索。L3代表案例有Cursor、Devin、Manus等，但离大家心中真正的Agent可能还有一点距离。至于L4和L5，具体形态如何，可能需要脑补了。

「注」：这些问题很值得深思，比如怎么到L1的，是Scaling Law吗？怎么到L2的，只是从快思考模式到慢思考模式吗？

「注」：通用的本质是去特化。模型能力不再受限于数据格式，而是规模；推理能力不再受限于规则，而是奖励。智能体能力不再受限于流程结构（Workflow），而是简约设计（Less is More）。

「注」：DeepSeek-R1技术报告刚出来时，诸多反应皆是「大道至简」，工程人士和架构师的最爱。

「注」：那问题来了，技术人员眼中的「Aha Moment」应该是什么样的呢？

「注」：那么「提示工程」和「Workflow」到底是不是「弯路」，可能事情并非那么绝对。不过L2让我们看到了「提示工程」简化的曙光，L3也让我们看到了「Workflow」简化的可能。

「注」：事物的初期一定是不完美的，但「取法乎上，得乎其中」，想象DeepSeek-R1的训练成本的逻辑，其实是一个道理。这里「看见」应该有几层含义：一是推理过程可观测可干预，这是个产品体验问题；另一个是推理要白盒化，其实就是「开源」。

2. 定义Agent

「注」：这里的嘲讽值直接拉满了，哈哈。

「注」：其实「套壳」这个词已经「骂」得很委婉了，写过代码的应该都听过这句话：「你这不就是包了个皮么」，自己体会【手动狗头】。做模型训推的看做模型应用的，和当年做基础技术的看做Web服务的可能是同一拨人，这种行业技术「鄙视链」一直存在。但是很多人忘了做模型训推和基础技术到底是为谁服务的？吃饭砸锅，这种事屡见不鲜了。

「注」：不管是传统软件工程，还是大模型软件工程，产品力永远有价值！

「注」：在「看见」这一条上，Manus的产品力着实令人惊艳。

3. 实现原理

「注」：做出Agent千篇一律，做好Agent万里挑一。直观上，推理模型提升了任务拆解能力，但只靠推理模型并不一定是最终答案。MCP提供的是标准，但标准的普及和适配仍需要时间。

「注」：去年Workflow几乎成为Agent的标配，但也成为了Agent通用化的软肋。我们也看到一些变通的工作，比如自动工作流生成（AFlow）。未来，是否应该是自动Agent生成（无Workflow）。

「注」：「Less Structure, More Intelligence」，这是极具Unix哲学的理念。

「注」：再回头看，「虚拟机」和传统意义的工具（搜索、浏览器、IDE）的差异是什么？想一想PC时代的人机关系：它是不是一直都是连接这些工具和人的「MCP」？当然，现在叫ACI（Agentic Compute Interface）。

「注」：打了榜，仍有质疑。不打榜，连牌桌都上不去。

「注」：先试被「惊」到，然后打开YouTube，试了一下「K」和「3」......

「注」：AHPU，这应该是智能体时代的「用户停留时间」了。

「注」：所以大模型时代的「杀手级应用」出现的时刻，也是大模型的「摩尔定律」诱发质变的时刻。更小的模型、更快的性能、更优的结果，历史经验告诉我们创新就是这么「既要也要还要」产生的。

「注」：从「Use Browser」到「Not In Browser」，再到「Browser In Cloud」。这产品思维也是没谁了！

「注」：虚拟机提供了两个重要的技术价值：「错误容忍（Fault Tolerance）」和「无状态化（Stateless）」。

4. 使用体验

「注」：引导提示词输出金句SVG是「继刚」的专长，Manus将此效果进一步放大了。

5. 暴论输出

「注」：很好，行业里的热门词基本上都在这了。

「注」：未经校验的预测永远都会被怀疑，没毛病。

「注」：「这不就是XXX么」的潜台词是「我X，这我也能搞啊」，然后是拍一下大腿「为啥我没这么搞」，再然后就是「好事怎么让你给占了」，最后含泪吞下一片「奥美拉唑」。

「注」：反正不是在套壳，就是在套壳的路上，你套我套大家套，挣钱嘛，不寒碜。

「注」：从早上200星开始关注，刷着劲宇的朋友圈（PS：也是AFlow的作者），眼看着一天破万星，社区热闹得感觉过了个小年。当然OWL也很错了，现在也破万星了。

「注」：有时给人的体感就是这样，「Money Out, Infra In; Training In, LLM Out」，好像大模型时代的创新只有大模型了，是不是还是技术鄙视链在作祟？

「注」：简单说就是「我能接受你笨点，但别让我手把手教」，想想你带不动的「队友」是不是也酱紫？

「注」：先不说模型能不能做到，如果这个世界「丰富」到只有模型，你觉得会是好事吗？

「注」：你的大厂会跟进，但你的老板还真不一定哈哈......

「注」：无意义的争论纯粹是浪费时间。

「注」：看「Richard Lin」直播Manus时，经常会说「我这是不是在PUA他」。看看最近热门的「PUA提示词」，动不动就是「干得好奖励十个亿，干不好你老婆就没命」。人和AI的博弈，才刚刚开始。

「注」：2025，与君同行！

参考资料

Manus没有秘密.pdf

上一篇：工厂变电所运维云平台解决方案-直击运维痛点，重塑高效安全运维典范

下一篇：llama源码学习·model.py[1]RMSNorm归一化

热门推荐

01GitHub 镜像站点 02幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 03AI科技热点日报 | 2026年07月01日 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 092026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？10几个好用的ip纯净度检测网站