10万一个邀请码!Manus的AI神话是技术革命还是“缝合怪”狂欢?带你一探究竟(最详细Manus测评、分析、感悟)

一、Manus现象级爆火:从Demo刷屏到天价邀请码

2025年3月6日凌晨,一款名为Manus的AI Agengt横空出世,迅速占领科技圈头条。其宣传视频中展示的"全能助手"形象------从撰写报告、筛选简历到炒股分析一气呵成------瞬间点燃全网热情。不少人惊呼这是在DeepSeek爆火之后,中国人工智能领域又一次震撼世界的创造!众多"大佬""媒体"也不愿错过这次"人工智能浪潮",纷纷为Manus站台宣传,一副我国已经实现AGI的态势(AI Agent和AGI具体解释可参考笔者文章一文读懂2025核心概念 AI Agent

鉴于Manus释放的视频过于震撼,AI领域的众多关注者都跃跃欲试想体验Manus的全能效果。然而Monica.im公司因为服务器资源限制只开放了内测邀请码的方式。短短48小时内,Manus的邀请码在二手平台被炒至5万元至10万元天价。

然而这场狂欢的背后,也充满了质疑的声音。有学者质疑到:"官方仅通过一部全英文宣传的视频和少量内测案例造势,绝大多数用户对实际效果一无所知"。再结合Manus团队创始人肖弘深谙流量运营之道,曾依靠简单的套壳打造用户超千万的海外AI工具Monica,此次Manus团队"限量邀请码+社交媒体KOL造势"的组合拳会不会又是一场流量收割?

本篇文章,笔者通过AI大佬"数字游牧人"对Manus的深度测评,带大家详细认识Manus的现有能力,核心原理以及通过这次Manus爆火事件,笔者作为AI技术爱好者产生的感悟。(省流:Manus只是一个套壳应用,其核心技术非常薄弱,详情看我下方具体的评测)

二、全网最深度Manus评测

2.1 Manus的界面设计

Manus的系统由两部分组成,左边栏是熟悉的聊天对话框,右边栏Manus很巧妙的设计了一个命令行窗口,你在左边提问之后大模型生成的所有操作步骤,Manus都可以自动在右边命令行窗口展示并执行,感觉就像在真正操作电脑一样!

一般的AI软件都会把中间步骤省略,但Manus的这波操作非常聪明,它将步骤巧妙的使用系统沙箱展示,让对相关技术不熟悉的普通用户觉得好像AI在操作你的电脑一样。 界面设计好评。不过该展示技术还是十分简单且有很多开源工具使用,技术难度不高。

2.2 Manus任务实测

界面设计Manus确实很有创造力,但它的能力还是要通过实际任务来检验,下面我就通过几个实例逐步评测Manus并揭示它的技术原理

任务一:写小说

任务难点: 长文本生成, 流程分析

第一个任务是让Manus帮我们写一篇小说,提示词是:【给我详细讲讲容器、虚拟机的发展、写成一本传记小说,让我明白技术的来选原理发展等。 5000字即可】

问题发给Manus后它完成的第一步是使用大语言模型(Manus后台使用的应该是通义千问和Claude 3.7模型)生成一个计划列表。然后根据列表的每一项调用相应的工具去完成任务。 比如这里第一个任务【研究虚拟化技术的早期黑历史】Manus就会调用搜索工具去互联网上进行搜索,这其实是用到了大语言模型的Function Calling技术,该技术是构建AI Agent的必备技术,已经相当成熟。

Manus在调用完联网搜索工具后,会返回给我们搜索得到结果,我这里试了一下和我自己在Google搜索得到的结果比较一致,应该调用了Google搜索的插件。然后Manus将它搜索得到的结果给大语言模型进行处理,这其实和DeepSeek联网搜索功能一模一样。

Manus每完成一项任务后,就会在计划列表里打X,然后循环往复直到把计划列表里的研究阶段工作全部完成。

长文本的生成一直是大模型的痛点,大模型无法一次性生成很长的文本,Manus本质是对大语言模型的调用,所以它也无法解决该问题。它的处理方法是先使用一个大语言模型列出写作阶段大纲,然后按照大纲提问大语言模型很多次,把得到的多次结果拼接形成最终的输出(嗯确实没啥技术难度),这导致了一个问题是我在读生成结果时发现不同章节之间的关联性时强时弱,总之结果文章"一眼AI"。

任务结论: Manus没有技术创新,只是按流程编排了大模型并逐步得到结果,长文本生成能力一般,使用的也都是现有技术。

任务二:撰写比价报告

任务难点: 自动登录,数据分析

第二个任务我们想让Manus帮我们写一份比价报告(比较接近日常工作),提示词是:【我要买一个小米ai眼镜,请在淘宝,咸鱼,1688,拼多多等平台比价,选择价格最低的那个商品链接给我,帮我省几块钱】, Mnaus在得到任务指示之后也是先进行计划列表的构建,然后按照计划列表一步一步完成。

很快我们就发现了Manus的不足,我们都知道想在淘宝网页获取信息我们需要登录,Manus自动操作浏览器也遇到了这个问题,但它的解决方案就是发现打不开后直接跳走,这个信息我不搜了。我自动去下一个,比如小米官网不用登录就可以获得信息。到最后甚至有的信息比如标题写了: 仅需339元,Manus直接将339作为最后价格,连网页也不打开,执行过于粗糙。 试想你一个公司实习生,老板让你总结一份报表,你直接把网页搜索的结果作为最后报表内容,都没有进行精细调研,那你准备干一个月骗点工资走人吧。

任务结论: Manus并没有做到自动登录验证等复杂任务,只是简单进行了搜索和总结,还是目前大模型那一套。

任务三 财报分析,Web编程

任务难点: 数据分析,编程

第三个任务我们上点难度,这部分就要涉及到数据分析和编程了,真正检验一下Manus的"智能力",提示词:【你是个职业的二级分析师,擅长财务估值建模,建模精准、漂亮。请为英伟达做详细的excel建模估值,数据可使用程序爬取。】 执行还是和上面类似流程,先做计划然后按照执行,不过这次是按照我们要求,没有使用联网搜索的功能,而是让大模型编写了python程序从雅虎finance免费接口中获取数据。自动编程很多工具目前也可以做到,我也发表过文章VsCode+Cline+Continue搭建免费AI编程助手

其它细节的执行过程我这里就不放了,和上面的流程一样。不过我中间发现了一个很奇葩的点,有个脚本是调用API去查询股票信息,但股票模拟数据直接硬编码在程序之中(也就是说还没查就有数据了),这可能是大模型的幻觉造成的,我也人工去查询了一下该数据,发现只能对30%。更致命的因为Manus完成任务要持续好多步骤,错误是不断累积的,这些错误也被带到了下文。

生成报告中AMD的这种PE就是错误的值

编程任务我这边是让Manus去【帮我写一个Google模拟经营小游戏】,具体的过程这里不进行罗列了,最后的结果就是Manus在使用NestJS(全栈框架)帮我写好后,打开第一个功能就出错了,然后Manus尝试修复没成功就直接告诉我开发完了,但是测试发现有Bug。 让Manus帮我部署上线,他找了一圈发现NestJS无法成功部署,建议切换成单页面程序。其实Mnaus演示中放出的那些图表展示网页也都是单页面程序,它还是无法对我们现在常用的工程项目完成部署。对于现在的几乎所有大模型都可以轻松做到开发部署单页应用。

任务结论: Manus的数据分析,还是会出现幻觉错误累加的情况。编程能力和部署能力也和现在模型并无一二,只是调用了大语言模型的编程功能。

2.3 Manus核心原理和不足

大家看到这里想必内心对Manus的核心原理也掌握的差不多了,它其实就是以下工具的组合:

复制代码
大语言模型:Qwen, Claude 3.7
搜索工具
虚拟机和自动工具界面
编程工具
静态页面部署工具
内置提示词

这些工具目前都有成熟的解决方案,比如大语言模型扮演"脑子"角色,搜索工具扩充了大语言模型获得实时信息的能力,编程工具利用Python语言编写程序(很多Manus的能力都是因为Python本身很强,而不是Manus作了什么额外操作,这很容易让不懂编程的同学被忽悠),内置的提示词将这些工具串起来。(提示词工程笔者也有文章: 与大模型对话的艺术:提示词工程指南)这其中最有逼格的可能就是虚拟机和自动工具界面,这确实是Manus的一个创新,也是Manus最吸引用户的地方。

还有一个吐槽的点是,因为Manus用到了大量的计划步骤和推理,所以它的token消耗量特别大,有人统计过一次提问消耗的token量按OpenAI价格计算达到了50元,说实话这花费不如去请人工。

三、Manus平替网站列表

因为Manus的核心技术确实不高,而且还要高额的邀请码,众多技术大佬坐不住了纷纷出场编写类似Manus的开源产品,目前开源的一些产品和链接如下,大家没有Manus邀请码的也可以访问部署以下应用测试,体验AI Agent的魅力:

  1. OpenManus :目前 star 数最高的 Manus 开源替代项目,由 MetaGPT 团队成员在3小时内快速开发完成。它定位为一个无需邀请码即可使用的 AI 助手替代方案,可以直接在用户本地电脑上运行,能够直接见证 AI 代理是怎么一步步操控自己的电脑完成各种任务的。 地址: github.com/mannaandpoe...

  2. AutoMate :一款 AI+RPA 工具,能让 AI 成为你的 "数字员工",通过自然语言描述任务就能自动操作电脑界面,完成复杂工作流程,无需编程知识。地址:github.com/All-Hands-A...

  3. OpenHands :由多个智能体组成的一个 "AI 程序员",能够执行现实中各种开发任务,包括代码修改、命令运行、网页浏览、API 调用、甚至是从 StackOverflow 复制代码片段。地址:github.com/All-Hands-A...

四、总结与感悟

Manus说白了就是将一系列目前工具组合起来的套壳产品,不能说Manus没有创新,毕竟这种交互的形式和体验感是Manus创造的,它是一款很好的产品,但它并没有引导AI科技任何的进步,更不会是很多博主自媒体营销号所说的Manus是人工智能的未来,是我国人工智能领域的又一革命性技术!它只是一个产品!

我不反对Monica.im公司通过Manus营销手段圈钱,毕竟圈钱也是一门"技术",但真正推动我国AI领域科技进步,推动AI领域快速发展,推动AI便利人类生活造福世界还是一个很漫长的过程,在这个过程中我们不妨放慢脚步,去多研究研究底层促进AI进步的"干货"。

我特别欣赏PyTorch作者之一 Horace He说的一句话:"研究中令人沮丧的是,回顾历史99%的论文只是讲故事,它们不会成为真正成为推动AI进步主流发展的一部分,所以我选择放弃我的论文论著,加入Pytroch,做点需要深度思考和真正编码的事!",如果现在大模型研究者都像Horace He一样,现在的AI应该已经造福人类了吧~

Manus这波热潮,是时候该扑灭了!大家有功夫不如去研究研究阿里巴巴最新32B QWQ推理大模型,它更可能成为未来!

感谢自写文章以来大家的支持,随着人工智能大模型的火热,pytorch作为人工智能大模型开发必备的基础工具成为每个AI研究者必学内容, 各位看官感兴趣也可以关注我的微信公众号: 大模型真好玩 并回复pytorch分享, 即可免费获得我读研期间学习过最好的pytroch教程pdf~

相关推荐
曲幽11 分钟前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers
Mintopia31 分钟前
OpenClaw 对软件行业产生的影响
人工智能
陈广亮1 小时前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬1 小时前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia2 小时前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能
爱可生开源社区2 小时前
DBA 的未来?八位行业先锋的年度圆桌讨论
人工智能·dba
叁两5 小时前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
敏编程5 小时前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪5 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain