阿里通义开源啦,源码地址+部署脚本,让AI会“做研究”

大家好,我是小悟。

最近,阿里通义正式开源了他们的首个深度研究Agent模型------DeepResearch。

简单来说,它是一种能像人类研究员一样,自主完成信息搜集、分析、推理,最后形成有价值结论的AI模型。

根据公开信息,它在多个国际权威评测集上,比如HLE、GAIA、BrowseComp这些"硬核考试"中,都拿到了SOTA的成绩。

更厉害的是,它只用了3B的激活参数,就超越了像OpenAI的o3、DeepSeek-V3.1和Claude-4-Sonnet这些动辄更大更复杂的模型所驱动的Agent。

并不是靠堆参数或者砸数据来硬推效果,而是搭建了一套以合成数据为核心、贯穿预训练和后训练的完整训练体系。

说白了,就是用更聪明、更高效的方式去"教"这个模型,让它不仅学得快,而且学得准,还能举一反三。

另外,在推理阶段他们也做了创新,设计了两种模式:一个是ReAct,用来考察模型的基础能力。

另一个是他们自研的IterResearch驱动的Heavy模式,专门用来挖掘模型在长时间、复杂任务中的潜力。

这就好比一个学生,不仅能答好基础题,还能在面对压轴大题时稳住心态、一步步拆解问题,最终给出高分答案。

值得一提的是,这个模型可不是只存在于实验室里的"理论派"。阿里已经把它用在一些实际场景中了,比如跟高德合作推出的"小高老师",能帮你做复杂的旅行规划。

还有通义法睿,据说能像初级律师那样,自动检索案例、分析法规,做法律方面的深度研究。

这些落地应用,证明DeepResearch不只是刷榜神器,而是真的有能力在现实世界中解决问题。

其实,这并不是阿里第一次在Agent领域发力。今年他们还陆续开源了WebWalker、WebDancer、WebSailor等项目,在智能体的数据合成和强化学习方面也取得了很不错的成绩。

可以说,DeepResearch的开源,是他们在这一方向上的又一个重要里程碑,也进一步丰富了他们在开源生态中的布局。

从个人角度来看,这次DeepResearch的开源,不仅仅是一个技术突破,更像是一种信号:AI正在从"能回答问题"向"能深入研究问题"迈进。

而阿里用一个相对轻量级(3B激活参数)的模型做到这一点,给整个行业都提供了新的思路和可能性。

未来的AI,肯定不是只会聊天的工具,而是能真正帮我们解决问题、甚至参与到复杂决策过程中的伙伴。而像DeepResearch这样的模型,正在让这一天加速到来。

阿里这次不仅开源了模型本身,连框架和方案都一并开放了,代码托管在GitHub、Hugging Face和魔搭社区,可以直接去下载、研究和二次开发。

快速入门

1、环境配置

推荐 Python 版本:3.10.0(使用其他版本可能导致依赖问题)。

强烈建议使用 conda 或 virtualenv 创建隔离环境。

ini 复制代码
# Example with Conda
conda create -n react_infer_env python=3.10.0 
conda activate react_infer_env

2、安装

安装所需的依赖项:

复制代码
pip install -r requirements.txt

3、准备评估数据

在项目根目录下创建一个名为 eval_data/ 的文件夹。

将您的QA文件以JSON格式放置在这个目录中,例如 eval_data/example.json。

每一行必须是一个包含以下两个键的 JSON 对象:

json 复制代码
{"question": "...","answer": "..."}

在 eval_data 文件夹中提供了一个示例文件供参考。

如果你计划使用文件解析器工具, 需将文件名添加到问题字段前 ,并将引用的文件放置在 eval_data/file_corpus/ 目录内。

4、配置推理脚本

打开 run_react_infer.sh,并按照注释中的说明修改以下变量:

MODEL_PATH - 本地或远程模型权重的路径。

DATASET - 评估集的路径,例如 example。

OUTPUT_PATH - 用于保存预测结果的路径,例如 ./outputs。

根据您启用的工具(检索、计算器、网络搜索等),提供所需的 API_KEY、BASE_URL 或其他凭证。每个密钥在 bash 脚本中均有内联说明。

5、运行推理脚本

复制代码
bash run_react_infer.sh

这种开放的态度,对于整个AI社区的推动作用是巨大的。毕竟,只有更多人参与进来,这个技术才能更快进化,应用场景也能更广。

谢谢你看我的文章,既然看到这里了,如果觉得不错,随手点个赞、转发、在看三连吧,感谢感谢。那我们,下次再见。

您的一键三连,是我更新的最大动力,谢谢

山水有相逢,来日皆可期,谢谢阅读,我们再会

我手中的金箍棒,上能通天,下能探海

相关推荐
喵个咪37 分钟前
go-wind-cms 微服务架构设计:为什么基于 Kratos?
后端·微服务·cms
神奇小汤圆43 分钟前
百度面试官:Redis 内存满了怎么办?你有想过吗?
后端
喵个咪1 小时前
Headless 架构优势:内容与展示解耦,一套 API 打通全端生态
前端·后端·cms
开心就好20251 小时前
HTTPS超文本传输安全协议全面解析与工作原理
后端·ios
小江的记录本1 小时前
【JEECG Boot】 JEECG Boot——数据字典管理 系统性知识体系全解析
java·前端·spring boot·后端·spring·spring cloud·mybatis
神奇小汤圆1 小时前
Spring Batch实战
后端
喵个咪1 小时前
传统 CMS 太笨重?试试 Headless 架构的 GoWind,轻量又强大
前端·后端·cms
程序员木圭1 小时前
07-数组入门必看!Java数组的内存分析02
java·后端
喵个咪1 小时前
Go 语言 CMS 横评:风行 GoWind 对比传统 PHP/Java CMS 核心优势
前端·后端·cms
面向Google编程1 小时前
从零学习Kafka:位移与高水位
大数据·后端·kafka