大模型嵌入浏览器,Atlas 和 Gemini 将带来怎样的变革?

大模型时代,过去上网查资料,我们大多经历过这样的场景:一边在浏览器里打开一堆网页寻找信息,一边又得切换到聊天机器人窗口去提问。

比如看到一篇复杂的技术文章不太明白,我们可能复制一段粘贴给 ChatGPT,或者干脆打开新标签页去搜索解释。然而这些流程零散又低效 ------ 浏览器只是浏览器,AI 只是 AI,两者各司其职,需要我们人为地把信息从一个搬运到另一个。

有没有可能,让浏览器本身就变成你的 AI 助手,在你浏览网页的同时随时为你答疑解惑,甚至直接帮你操作?这种听上去有些科幻的体验,如今正随着 ChatGPT Atlas 浏览器和 Chrome Gemini 的出现而逐渐成为现实。


ChatGPT Atlas:让浏览器拥有大脑和双手

ChatGPT Atlas 是 OpenAI 于 2025 年 10 月 21 日发布的一款全新浏览器。

它的核心理念不是简单地给浏览器塞个 AI 插件,而是把浏览器当作 ChatGPT 的延伸。换句话说,这款浏览器本身就是 ChatGPT 驱动的。OpenAI 用一句话概括了 Atlas 的定位:"The browser with ChatGPT built in"(内置了 ChatGPT 的浏览器)。

Atlas 带来了几个突破性的功能:它能阅读理解网页内容、帮你写作、执行网页操作,甚至具备长期记忆,能记住你的浏览历史。与传统浏览器 + ChatGPT 插件相比,Atlas 把 ChatGPT 作为底层能力直接整合进浏览器中。你在 Atlas 里问的每一个问题、让 AI 做的每一步操作,都与 ChatGPT 服务融为一体,并同步记录在你的聊天历史中。换句话说,Atlas 不只是一个带壳的 ChatGPT,而是一次彻底的融合。

当然,它暂时只支持 macOS,Windows 和移动端版本还在开发中。Agent 模式虽然酷炫,但目前仍处于早期阶段,处理复杂任务时可能出错或执行较慢。


Chrome Gemini:将 AI 助理植入世界最大浏览器

而几乎同时,谷歌也推出了自家 Chrome 浏览器的 AI 集成方案 ------ Gemini in Chrome。

相比 OpenAI 从零打造新浏览器,谷歌直接把大模型嵌入现有的 Chrome。Chrome 本身是全球最流行的浏览器,用户基础庞大。

谷歌早在 2023 年就开始在搜索中融合生成式 AI,而到 2025 年 9 月,谷歌宣布旗下多模态大模型 Gemini 将深度集成进 Chrome 浏览器。这项功能让你的 Chrome 多了一个 AI 助手,能够理解网页内容、帮你总结、答疑,甚至联动谷歌生态完成任务。

三个阶段、两个模式

第一阶段:阅读帮手。

当前版本的 Gemini 重点在于帮助理解网页内容。当你打开 Chrome,会在工具栏看到一个 Gemini 图标。点击它即可提问网页相关问题,比如让它总结页面、解释术语或深入分析内容。Gemini 还能跨页面整合信息,例如一次分享十个标签页,让它自动生成对比表或行程清单。这种"多页整合"让信息汇总效率大幅提升。

Gemini 还支持模糊搜索浏览历史。你可以直接问:"上周我在哪个网站看过书桌?" AI 会帮你在历史中找出对应页面,甚至能模糊匹配主题。比如正在看一款床垫,它可能会提示你:「这个东西的保修政策是啥?」。移动端同样支持 Gemini,无论是 Android 还是 iOS,只需长按电源键或在悬浮窗中提问,AI 就能理解屏幕内容并作出解释或总结。

第二阶段:代理助手。 谷歌计划让 Chrome 拥有类似 Atlas 的 Agent 能力。未来你可以直接对 Chrome 说:"帮我预订理发"或"帮我下单常买的杂货",AI 会自动执行网页操作、填写表单并完成任务。同时 Chrome 会确保用户始终有控制权,关键操作需确认才能继续。

第三阶段:安全卫士。 Gemini 还用于提升上网安全。它内置的小模型 Gemini Nano 能识别诈骗、假警告、垃圾弹窗等内容并拦截。新版 Chrome 还基于 AI 判断通知是否可能打扰用户,从而减少无意义的弹窗。此外,Chrome 还支持"AI 一键改密",当检测到密码泄露时,AI 会自动导航并完成修改。


Atlas vs Gemini:两种 AI 浏览器的对比

对比维度 ChatGPT Atlas Chrome Gemini
设计理念 从 AI 出发重塑浏览器 在传统浏览器中嵌入 AI
交互方式 对话式主导,AI 优先 辅助式调用,用户优先
功能特点 内置 Agent、图像识别、写作辅助 网页摘要、跨标签整合、历史回忆
生态整合 依托 ChatGPT 插件体系 依托谷歌生态(搜索、日历、地图)
隐私策略 云端处理,支持关闭记忆 部分本地模型处理,更注重企业隐私
付费门槛 高级功能需订阅 ChatGPT Plus/Pro 基础功能免费开放

简而言之,Atlas 更像是"AI 浏览器的实验室原型",它展示了浏览器如何与大模型深度融合;而 Chrome Gemini 则是"面向大众的实用进化",通过在熟悉的界面里植入 AI,降低了学习门槛。一个追求革新,一个追求普及。


AI 浏览器的美好前景

  1. 信息获取更高效。 AI 浏览器能理解用户意图、提炼关键信息,让知识获取不再像"挖矿"。学生、工程师、研究者都能快速得到答案。
  2. 操作自动化与时间解放。 AI 代理可代劳繁琐任务,从购物下单到生成日报,让浏览器成为数字助理。
  3. 个性化与智能化体验。 AI 能学习你的阅读习惯与兴趣偏好,提供更贴心的推荐与辅助,让互联网变得更人性化。
  4. 降低数字鸿沟。 AI 浏览器让上网更容易,不懂搜索的人也能用自然语言提问,老人、孩子、残障人士都能更轻松地获取信息。

AI 浏览器的隐忧

  1. 准确性与信任。 AI 总结可能出现幻觉,用户若不验证原文容易被误导。
  2. 隐私风险。 AI 读取浏览内容可能带来数据泄露风险,厂商必须保障透明与安全。
  3. 内容生态冲击。 AI 直接摘要可能削弱网站流量与创作者收益,需要建立合理的内容回报机制。
  4. 算法偏见。 AI 的推荐与总结可能带有立场或偏见,未来应确保可解释与可控。

结语:当浏览器遇上大模型,变革已在路上

我们以为浏览器已足够成熟,却没想到 AI 的注入正在让它重生。从 Atlas 到 Gemini,我们见证了浏览器从信息门户向智能助理的转型。未来, "会聊天的浏览器" 将成为标配。它能帮你读懂世界、处理事务、保护安全,让上网变得像与智慧伙伴同行。

当然,AI 不会取代思考。它帮我们省下机械劳动,让我们有更多精力专注于创造与判断。大模型嵌入浏览器,是一次人与信息交互方式的革命。未来十年,我们将不再孤身在网络中摸索,而是与一个聪明的 AI 一起探索。

如果你已经体验过 Atlas 或 Gemini,或对理想的 AI 浏览器有自己的想法,欢迎分享你的观点。浏览器的进化还在继续,而我们正身处其中。

相关推荐
亚马逊云开发者4 小时前
基于Amazon Bedrock的TwelveLabs Marengo Embed 2.7多模态搜索系统
人工智能
Geoking.4 小时前
深度学习基础:Tensor(张量)的创建方法详解
人工智能·深度学习
海拥4 小时前
合合信息推出“多模态文本智能技术”:让AI真正理解与守护信息
人工智能
suke4 小时前
LLM入局,OCR换代:DeepSeek与PaddleOCR-VL等LLM-OCR引领的文档理解新浪潮
人工智能·程序员·开源
良策金宝AI4 小时前
良策金宝AI实战录:效率如何从口号照进现实?
人工智能·工程设计
字节跳动安全中心4 小时前
打造可信AI Agent:如何让智能体不跑偏、不越界,安全又靠谱
人工智能·安全·agent
音视频牛哥4 小时前
无人机安防体系的音视频超低延迟重构:从“空地融合”到“实时智控”
人工智能·音视频·无人机·大牛直播sdk·rtsp播放器·rtmp播放器·低空经济rtmp rtsp
ZHANG8023ZHEN5 小时前
深度学习的一些基本概念
人工智能·深度学习
aneasystone本尊5 小时前
深入 Dify 的应用运行器之模型调用
人工智能