聊聊AI浏览器 - 技术栈

提供AI咨询 +AI项目陪跑服务，有需要回复1

大模型一直有个难以解决的问题：系统的知识是过时的，他们难以跟进最新的信息。

基于这个原因，ChatGPT以及DeepSeek都提出了联网功能 ，只不过效果嘛绝不可能太好（绝不会有用会从CSDN搜寻程序员要的答案）：

AI应用团队的话，一般会使用爬虫到各个目标网站 整理信息，提前存入到知识库，以保证AI应用的先进性，只不过这在特定领域是适用的，如果是泛问题，知识库没有信息的话，模型依旧会胡说八道。

在这个基础上，事实上各个AI应用团队对AI浏览器是有诉求的，于是就有很多公司在做相关功能：

其实，RAG的本质和搜索引擎是很类似的，也可以将AI浏览器理解为一个MCP应用，提供给AI产品调用即可。

PS：抛开浏览器提供接口给我使用这个点，我其实已经想不到太多浏览器的生存空间了，

我只有在不想看AI回答的情况下，才会去用搜索，而且一定不是浏览器搜索...

以上是AI浏览器诞生的一些背景，以及我的一些认识，接下来我们来具体的了解其中一些表现不俗的AI浏览器。

从Arc到Dia

The Browser Company 成立于2019年，融资1个多亿，估值5.5亿美金。

其核心产品是Arc，一款被极客喜爱的浏览器，被认为远超Chrome的用户体验。

而在24年完成5000万美金融资后，其毅然决然的放弃了Arc的研发投入，开始转向为全新的AI浏览器研发。

同年，Dia浏览器发布，这也是现在被认为非常优秀的AI浏览器：

AI不会以一个应用或者一个按钮的形式存在，它将是一个全新的环境------建立在网页浏览器之上的。

这句话透露出一种坚定的信念：AI将不再是我们如今所见的简单工具，而是将彻底重塑我们与技术互动的方式，成为一个无处不在、深度融合的全新生态。

在使用之前，浏览器会搜集很多个人倾向性信息：

我猜测，他会根据用户的喜好，返回最合适的信息。

只不过使用下来，不知道是不是错觉，感觉跟Manus想要达到的体验很类似...

这其实都还是在走OpenAI的L3路径：

**L1级别（聊天机器人）。**AI系统能够进行基本的对话和交流，显示出对自然语言的基本理解能力，并能对各种提示和问题作出响应。

**L2：推理者（Reasoners）。**AI系统能够以人类专家的熟练程度解决复杂问题，标志着其从单纯模仿人类行为升级到展现真实的智能水平。这些AI不仅擅长对话，更具备了解决问题的能力，其推理和决策能力已接近人类水平。

**L3：智能体（Agents）。**AI系统能够承担复杂的任务、作出决策和适应不断变化的环境，并在无须持续人类监督的情况下自主行动。这一阶段的AI不仅具备推理能力，更能自主执行各类复杂的操作任务。

与其说他是浏览器，不如说他是智能体...

事实上，AI需要的不是浏览器，AI需要的是最新的知识库，并且真人使用的浏览器与AI想要的浏览器非常不一样。

比如Manus团队之前就想打造一款适应于AI的浏览器，以便AI产品的体验更好，最终他们也确实这么做了，这里以我的理解来说的话，与其说做了一个AI浏览器，倒不如说做了一个适应于AI使用的知识库。

综上，事实上我们是不需要AI浏览器的，我们只需要AI Agent，是AI Agent需要一个适应于他的浏览器（更确切的说是知识库），比如browser-use、Nova Act SDK。

只不过，浏览器是极其重要的关键词 ，因为他是一个非常好的入口，入口代表着流量，流量意味着争夺，所以很多公司都在开始布局AI浏览器，其本质其实在争夺下一个Agent入口...

事实上，从The Browser Company宣布放弃旗舰产品Arc、转投Dia研发时就是一个非常重要的信号：浏览器已不再是单纯的网页容器，而正在经历从"工具"到"智能体"的跃迁。

当AI出现那一刻，就宣布了传统浏览器的死亡，因为三大核心交互正在变化：

微软Edge Copilot的代码自动补全功能已展示这种转变：当开发者输入注释时，AI直接调用GitHub最新代码库生成解决方案，整个过程无需打开任何技术文档网站...

随着AI Agent的崛起，科技巨头纷纷布局，争夺下一代用户"入口"。现在有两类玩家：

对于已有入口占领者，会发挥好本来优势：

与此同时，各种新兴势力也在冲击这一领域：

这些公司通过不断扩展AI Agent的能力，推动用户体验的提升，争夺用户的核心"入口"，这个行为不再局限于操作界面，而是进入了工作流、决策支持和深度集成的层面。

具体到行业应用，AI Agent在各领域中的应用正以惊人的速度改变传统的用户体验。

例如，在医疗行业，AI Agent能够分析患者的病史、症状，并根据最新的医学研究提出精准的治疗建议。

在教育领域，AI Agent通过个性化学习路径帮助学生提高成绩，在金融行业，AI Agent可以帮助金融顾问根据实时数据做出投资决策。

在这些应用中，AI Agent的存在不再是"工具"，而是用户的"合伙人"。用户不再只是被动接受信息，而是通过AI Agent主动获取、分析和执行任务，这使得用户体验变得更加智能化、动态化。

尽管AI Agent的前景广阔，但它的发展仍面临诸多挑战。其中包括如何解决隐私保护问题、如何确保数据安全、以及如何实现算法的透明性等...