第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1

国产 AI 领域,从今天起有了既能深度研究又能动手操作的自主智能体产品。

这款神器叫做「AutoGLM 沉思」,来自中国公司智谱。

我们来看一个非常经典的案例:只需要输出你想讨论的话题,AI 就能自动去小红书、知乎等平台上深度查询、总结完整报告,并转化为面向大众的传播内容。短短 14 天里,AI 孵化出了一个 5000 多个粉丝的小红书账号,还接到了商单。

「起号」,从未如此简单高效:

3 月 31 日,智谱官宣了新一代 Agent 产品「AutoGLM 沉思」。

相比于此前 OpenAI 的 Deep Research 等产品,「动手能力」是 AutoGLM 沉思最大的亮点之一。它能够「边想边干」,像人类一样自动操作和浏览网页,这意味着知网、小红书、公众号、京东等优质却不对外开放 API 的信源都能被查看到,同时基于背后基座模型的多模态理解能力,这些网页上的图文信息也能被充分利用。

2025 年,大模型技术的演进来到了关键的新阶段:从单纯的语言模型到多模态模型,再到今天,我们终于看到了成熟的自主 Agent 产品,业内称之为「Agentic AI 时代」。更详细地说,我们触手可及的大模型应用已经从「生成式 AI 的单次响应」,真正升级为具备自主推理能力、指挥自身行动和工具调用的智能系统。

「AutoGLM 沉思」的面世,扛起了国产 AI Agent 落地的大旗。且在今天的发布后,「AutoGLM 沉思」即全量上线,免费开放给每一位用户。

体验方式:chatglm.cn/(下载「智谱清言」PC 客户端)

与此同时,我们也看到了智谱这家中国公司在 Agent 领域的领先技术布局,包括推理、多模态、记忆和工具。值得一提的是,「AutoGLM 沉思」基于的是智谱全栈自研的 Agent 技术,包括新一代推理模型 GLM-Z1-Air 和基座模型 GLM-4-Air-0414,前者性能比肩 DeepSeek-R1,在速度提升最高 8 倍的同时,价格仅需 DeepSeek-R1 的 1/30。

对于智谱来说,2025 年将是以「开源」为主题的一年。所有 Agentic 相关的模型和技术,包括基座模型 GLM-4-Air0414、推理模型 GLM-Z1-Air、沉思模型 Z1-Rumination、智能体框架,都将在 4 月 14 日正式开源。模型会在接下来的两周内,陆续上线智谱 AI 大模型开放平台(bigmodel.cn),惠及整个技术社区。

首个免费可用、具备强反思能力的 Agent 产品

智谱表示,「AutoGLM 沉思」可以视为自主智能体的「Preview 版本」,可以理解为 DeepResearch 和 Agent 的强强组合。

我们可以从三个方面去评价「AutoGLM 沉思」:

  • 深度思考:能不能模拟人类在面对复杂问题时的推理与决策过程。

  • 感知世界:能不能像人一样获取并理解环境信息。

  • 工具使用:能不能像人一样调用和操作工具,完成复杂任务。

打开智谱清言,说出自己的需求,也就是一段 Prompt,剩下的全部交给 AI:

Prompt:

分析问题:生成式 AI 技术对未来知识生产模式的颠覆性影响

具体要求:

对比传统学术研究与 AI 辅助研究的范式差异

选取至少 5 个典型领域(如医学、法学、文学,经济学,艺术学等)进行深度研究案例分析

字数要求一万字以上

到这里,我们都应该看出来「AutoGLM 沉思」的优势何在了。

「AutoGLM 沉思」在一般 Deep Reseach 的基础上,叠加了 AutoGLM 操作电脑浏览器的环境交互能力,有效促进了模型思考的宽度和深度,自然输出的内容也就更全面了。这也是第一个 C 端可以使用的拥有强反思能力的 Agent 产品。目前,AutoGLM 沉思的平均思考步骤在 20 步以上,拥有处理复杂问题的能力。

目前上线的是「AutoGLM 沉思」Preview 版本,比较擅长 Research 相关场景。在未来的两周,产品还将增加更多的 Agent 执行能力。

另一方面,「免费开放」的意义值得重视。以 OpenAI 的 Deep Research 为例,虽然功能上非常吸引人,但被惊艳到的也只是付费 200 美元购买了 Pro 套餐的那一波会员。而「AutoGLM 沉思」选择「免费」开放给所有用户,这延续了智谱的传统,也瞬间打破了海外 AI 公司制定的高昂价格门槛。

「AutoGLM 沉思」背后

智谱在下一盘 Agent 的棋

在百舸争流的技术大变革时代,模型能力的领先始终是智谱这家公司位于行业内的核心竞争力。在「AutoGLM 沉思」面世之前,智谱围绕 Agent 的技术布局已经持续多年。

可以说,这家公司见证、参与、引领了 Agent 技术的几个重要发展阶段:

智谱清言是最早具备 Function Call 能力的大模型应用。早在 2023 年 10 月,智谱就在当时的 ChatGLM3 基座大模型和智谱清言中引入了代码交互能力,并支持 AgentTuning 技术,让模型实现了自主规划任务并调用工具完成任务。

2024 年初,伴随着 GLM-4 的发布,智谱清言上线了 GLMs 个性化智能体定制功能。用户无需编程基础,即可通过简单的提示词指令创建专属智能体,并通过智能体中心分享和调用。

到了 2024 年底,智谱开放了「AutoGLM」。这是智谱第一个产品化的智能体 Agent,可以做到让 AI 通过语音直接操纵硬件设备,还能跨不同 App 全局操作。

每一次更新,都伴随着智谱在相关技术研发的突飞猛进。「AutoGLM 沉思版」的推出,意味着智谱 Agent 产品的又一次重大迭代,背后是更强大的基础模型、推理、Agent 框架。

在这场发布活动上,智谱透露了「AutoGLM 沉思」背后的关键技术进展:

技术演进路径:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。

首先是推理模型 GLM-Z1-Air。GLM-Z1-Air 是智谱基于扩展强化学习技术训练的新一代推理模型,面对复杂、开放问题,能够进行推理和反思,为 Agent 提供了强大的推理、规划与反思能力。其效果比肩 DeepSeek-R1,提速 8 倍,价格是 R1 的 1/30,可以在消费级显卡上运行。

在性能表现上,GLM-Z1-Air 可以与 DeepSeek-R1(671B,激活 37B)媲美。智谱在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中对 GLM-Z1-Air 进行了评估,评估结果显示 GLM-Z1-Air 展现了较为强大的数理推理能力,为更多复杂任务的解决提供了支持。

GLM-Z1-Air 背后的基座模型是 GLM-4-Air-0414, 以 32B 参数量比肩更大参数量的国内外主流模型。它在预训练阶段加入了更多的推理类数据,并在对齐阶段针对智能体能力进行了优化,在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。

在 GLM-Z1 的基础上,智谱又通过强化学习训练了沉思模型 GLM-Z1-Rumination,提升了模型结合工具使用完成长程推理能力。

同时,智谱在 MAAS 平台上将免费模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,并推出了对应的推理版本 GLM-Z1-Flash,在保留大部分效果的情况下更轻量级、更高速,完全免费调用,以适用于更广泛的应用场景。

在落地进程方面,智谱也已经有了清晰的规划:「智谱将专注于在 AGI 和基座模型研发方向,我们未来很长一段时间将专注于 Agentic GLM 相关模型技术的研发上。我们在基座模型上搭建智能体平台,以便帮助我们的生态伙伴调用智谱智能体的能力,打造基于行业、地域和场景的智能体应用。在行业生态方面,我们是模型厂商的占位,我们希望帮助应用合作伙伴做出成功的大模型应用。在城市生态方面,我们依然是模型厂商的占位,通过与当地龙头企业合作来赋能当地产业升级与政务的智能化。」

「传统的复杂工作流将不复存在」

技术和产品的飞速迭代,将为每一个人带来什么?

举例来说,近日 OpenAI 为 GPT-4o 增加了原生的图像生成功能,从网友的反馈到机器之心的亲身体会,生成效果都可以说是「一骑绝尘」,不管是人物真实性还是内容一致性。对于「文生图」这一赛道来说,GPT-4o 树立了一个全新的标杆,让所有的竞争对手又紧张了一下,也让这条赛道重新活跃了起来。

更重要的是,它指出了 AI 正在不断趋近理想中的状态:「所有传统的、复杂的工作流都将不再存在。」一句话 P 图、一句话玩手机、一句话写报告...... 不管是图像的生成和持续编辑,还是设备操控,都指向这一终极形式。

因此,我们能够看到「AutoGLM 沉思」所具备的划时代的意义:当推理模型的「深度研究」结合 Agent 的「动手执行」,它能够模拟人在面对复杂问题时的思考、能够像人一样感知这个世界、能够像人一样使用工具。

Chatbot 同样具有交互性和功能性,而 Agent 与之最大的差异就是自主性和适应性。「AutoGLM 沉思」的价值在于,模型实现了自己决策操作过程,能够通过连续、多步推理实现模型自主规划,并通过反思实现动态调整,不需要提前设计工作流。

从此以后,我们不需要再设计复杂的智能体工作流。这就是自主智能体的雏形,不久后的我们,或许就能触摸到 AI 作为生产力工具的理想形态。

就像领域内最近在讨论的观点:我们所有人都在一架上升的电梯里,你可以站着不动,也可以原地俯卧撑。但最终,都能轻松抵达那个曾经遥不可及的高点。

相关推荐
Hali_Botebie37 分钟前
【蒸馏用损失】NCEloss介绍,大规模分类任务的损失函数
人工智能·分类·数据挖掘
阿里云云原生38 分钟前
RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用
java·人工智能·spring
蚍蜉撼树谈何易41 分钟前
机器学习的定义及分类
人工智能·机器学习·分类
城电科技2 小时前
城电科技|零碳美丽示范村建设方案 能源+景观+教育
人工智能·科技·生活·能源
opentrending6 小时前
Github 热点项目 awesome-mcp-servers MCP 服务器合集,3分钟实现AI模型自由操控万物!
服务器·人工智能·github
lisw057 小时前
DeepSeek原生稀疏注意力(Native Sparse Attention, NSA)算法介绍
人工智能·深度学习·算法
whaosoft-1437 小时前
51c深度学习~合集4
人工智能
逢生博客7 小时前
阿里 FunASR 开源中文语音识别大模型应用示例(准确率比faster-whisper高)
人工智能·python·语音识别·funasr
哲讯智能科技8 小时前
智慧能源新篇章:SAP如何赋能光伏行业数字化转型
大数据·人工智能
云卓SKYDROID8 小时前
无人机DSP处理器工作要点!
人工智能·无人机·科普·云卓科技