Anthropic 这次是真的不讲武德。
就在今天凌晨(2025年11月25日),当我们还在睡梦中时,Anthropic 突然发布了最新的旗舰模型------Claude Opus 4.5。
参数非常亮眼:200K 的上下文窗口,执行相同任务比前代节省 76% Token。官方还顺手更新了 Claude Code,默认模型也换成了 Opus 4.5。
🔥🔥🔥本篇笔记所对应的视频: www.bilibili.com/video/BV11n...
但真正让我们从床上惊坐起的,不是模型参数,而是同步推出的"核弹级"产品:
Claude for Chrome ------ 浏览器原生自动化插件。
OpenAI 的 Atlas 浏览器虽然强悍,但毕竟需要用户迁移到一个全新的浏览器上。而 Anthropic 这次直接"偷家",在用户最熟悉的 Chrome 里实现了一键自动化。
官方号称它可以实现"真正的浏览器自动化",甚至替代 Atlas。口说无凭,还是看实测。 本期内容,我们把这款插件扒了个底朝天,进行了9轮地狱级测试。
01 基础能力:从阅读到视觉的"丝滑"体验
安装过程非常简单,点击安装后,Chrome 侧边栏会出现熟悉的 Claude 图标。界面布局和 OpenAI 的 Atlas 侧边栏非常像,有"询问"和"全自动执行"两种模式。
我们先来几道"开胃菜"。
第一测:知识库大考
直接发问:"你的知识库截止日期是什么时候?"
Claude 秒回:2025年5月底。
这个数据目前是最新的,比 GPT-5.1 和 Gemini 3 的知识库都要新出一截。对于需要查询最新技术文档的开发者来说,这绝对是个好消息。
第二测:长文总结与图表读取
我们打开 Anthropic 刚刚发布的 Opus 4.5 官方介绍页,扔给它一个指令:"总结这篇文章"。
它不仅迅速提取了"定价降低"、"效率提升"、"安全性"等核心卖点,还展现了惊人的视觉能力。
当我们让它"解读网页上的配图"时,它精准识别出那是一张软件工程性能基准测试的柱状图,甚至读出了 Opus 4.5 排名第一的具体参数。这不是简单的 OCR,而是真正的多模态视觉理解。
第三测:选中翻译
鼠标选中网页上的一段英文,输入"翻译为中文"。
Claude 通过后台截图的方式获取了选区内容,并给出了信达雅的翻译。虽然这是基操,但在插件里完成得非常流畅,没有任何割裂感。
02 进阶实测:社交媒体与多Agent雏形
热身结束,下面进入正题:浏览器自动化(Browser Automation) 。
第四测:自动发帖,它居然自己点了"发送"!
我们给它下达指令:"将刚才总结的文章改写,并发布到 X(原Twitter)上。"
Claude 的操作行云流水:
- 改写文案。
- 自动打开 X 平台。
- 定位输入框,粘贴文案,贴心地打上了 Tag。
- 高能时刻:它自动点击了"发布"按钮!
老用户都知道,OpenAI 的 Atlas 浏览器在最后一步通常需要人工确认,比较保守。但 Opus 4.5 非常自信,直接完成了闭环。这种"一条龙服务"虽然有点激进,但效率真的是高。
第五测:左右互搏,AI 对话 AI
我们搞了个骚操作:让 Claude 去找 ChatGPT 聊天。
指令:"打开 ChatGPT,探讨人类何时能飞抵半人马座阿尔法星。"
接下来的场面非常科幻:
- Claude 自动打开 ChatGPT,在输入框打字提问。
- ChatGPT 回复了一大堆关于推进系统、能源需求的技术分析。
- Claude 读取回答后,觉得意犹未尽,自动追问:"到达后发现宜居星的概率有多大?"
- ChatGPT 继续回答,Claude 继续分析总结。
这完全模拟了多 Agent 协同的过程。你只需给出一个话题,两个顶尖 AI 就能在你的浏览器里把这事儿聊透,而你只是个吃瓜群众。
03 高难度实测:游戏与跨生态操作
第六测:全自动下国际象棋
能不能让它自己在网页上玩游戏?
我们让它打开国际象棋网站,"全自动下棋"。
Claude 不仅能识别复杂的棋盘布局,还能理解规则。它控制鼠标选中棋子、移动棋子,每一步都逻辑在线。相比 Atlas 之前在动态网页上的卡顿,Claude 在 Chrome 里的表现非常稳健。
第七测:翻车现场------Google AI Studio 内存泄漏
为了测出底线,我们上了"核弹级"难度。
指令:"打开 Google AI Studio,写一个记忆配对卡片游戏,如果不满意就自动修改。"
起初一切顺利,Claude 写出了游戏代码,甚至还包含"配对成功庆祝特效"。但在我们要求它"进行评判并修改"后,问题出现了。
在反复调试的过程中,Chrome 的内存占用开始狂飙,电脑风扇疯狂咆哮,机身温度直线飙升,甚至开始烫手!
出于安全考虑,我们不得不手动点击"Stop Claude"终止了任务。看来,让 AI 在网页端进行高强度的代码迭代和实时渲染,目前的浏览器环境优化还有待加强。
04 生产力实测:数据处理与跨模态闭环
第八测:跨标签页数据录入(含幻觉预警)
这是一个典型的办公场景:
指令:"搜索特斯拉股票,抽取3个核心字段,打开 Google Sheets 填入,并汇报。"
Claude 展现了强大的多标签页(Multi-tab)管理能力:
- 新开标签页搜特斯拉股价。
- 进入 Google Finance 抓取数据。
- 切回原来的标签页,确认信息。
- 打开 Google Sheets,精准定位单元格,填入数据。
但是,这里出现了一个致命的幻觉!
今天是 2025 年 11 月,但它填入表格的日期却是 2024年 11 月 24 日。
虽然填表动作满分,但这种细微的事实性错误再次提醒我们:在处理财务数据时,AI 目前还不能完全当甩手掌柜,人工复核依然必要。
第九测:跨生态降维打击
最后,我们让 Claude 去"调戏" Google 的 Gemini。
指令:"打开 Gemini,选择 nano banana pro 模型(这名字也是绝了),生成一张素描风格的小猫晒太阳图,并评价。"
Claude 熟练地打开竞品网站,切换模型,输入英文提示词(它知道 Gemini 对英文支持更好)。图片生成后,它甚至自动点击图片进行放大,以便观察细节。
最后的评价非常专业:"10分给9分,光影效果出色,素描质感真实......"
这种跨生态、跨模型的调用能力,才是浏览器插件形态最大的优势------它不被任何单一生态捆绑,它可以是所有网页的"上帝"。
总结:Atlas 杀手?
经过这9轮实测,结论已经很明显了。
Claude Opus 4.5 + Chrome 插件,确实展现出了惊人的即战力。
- 优点:速度极快,多标签页协同能力强,操作逻辑像人,敢于替用户做决断(如自动发布),且无需迁移浏览器。
- 缺点:高负载任务(如游戏开发调试)会导致设备过热和内存泄漏,偶发性的时间幻觉依然存在。
Atlas 还有活路吗?
OpenAI 的 Atlas 依然是目前最强的独立 AI 浏览器,但在用户习惯这道高墙面前,Anthropic 这一招"寄生战术"确实太狠了。你不需要为了 AI 换个浏览器,你只需要给你的 Chrome 装个"大脑"。
在这个 AI 疯狂卷的 2025 年,浏览器自动化的时代,真的来了。