阿里通义开源啦,源码地址+部署脚本,让AI会“做研究”

大家好,我是小悟。

最近,阿里通义正式开源了他们的首个深度研究Agent模型------DeepResearch。

简单来说,它是一种能像人类研究员一样,自主完成信息搜集、分析、推理,最后形成有价值结论的AI模型。

根据公开信息,它在多个国际权威评测集上,比如HLE、GAIA、BrowseComp这些"硬核考试"中,都拿到了SOTA的成绩。

更厉害的是,它只用了3B的激活参数,就超越了像OpenAI的o3、DeepSeek-V3.1和Claude-4-Sonnet这些动辄更大更复杂的模型所驱动的Agent。

并不是靠堆参数或者砸数据来硬推效果,而是搭建了一套以合成数据为核心、贯穿预训练和后训练的完整训练体系。

说白了,就是用更聪明、更高效的方式去"教"这个模型,让它不仅学得快,而且学得准,还能举一反三。

另外,在推理阶段他们也做了创新,设计了两种模式:一个是ReAct,用来考察模型的基础能力。

另一个是他们自研的IterResearch驱动的Heavy模式,专门用来挖掘模型在长时间、复杂任务中的潜力。

这就好比一个学生,不仅能答好基础题,还能在面对压轴大题时稳住心态、一步步拆解问题,最终给出高分答案。

值得一提的是,这个模型可不是只存在于实验室里的"理论派"。阿里已经把它用在一些实际场景中了,比如跟高德合作推出的"小高老师",能帮你做复杂的旅行规划。

还有通义法睿,据说能像初级律师那样,自动检索案例、分析法规,做法律方面的深度研究。

这些落地应用,证明DeepResearch不只是刷榜神器,而是真的有能力在现实世界中解决问题。

其实,这并不是阿里第一次在Agent领域发力。今年他们还陆续开源了WebWalker、WebDancer、WebSailor等项目,在智能体的数据合成和强化学习方面也取得了很不错的成绩。

可以说,DeepResearch的开源,是他们在这一方向上的又一个重要里程碑,也进一步丰富了他们在开源生态中的布局。

从个人角度来看,这次DeepResearch的开源,不仅仅是一个技术突破,更像是一种信号:AI正在从"能回答问题"向"能深入研究问题"迈进。

而阿里用一个相对轻量级(3B激活参数)的模型做到这一点,给整个行业都提供了新的思路和可能性。

未来的AI,肯定不是只会聊天的工具,而是能真正帮我们解决问题、甚至参与到复杂决策过程中的伙伴。而像DeepResearch这样的模型,正在让这一天加速到来。

阿里这次不仅开源了模型本身,连框架和方案都一并开放了,代码托管在GitHub、Hugging Face和魔搭社区,可以直接去下载、研究和二次开发。

快速入门

1、环境配置

推荐 Python 版本:3.10.0(使用其他版本可能导致依赖问题)。

强烈建议使用 conda 或 virtualenv 创建隔离环境。

ini 复制代码
# Example with Conda
conda create -n react_infer_env python=3.10.0 
conda activate react_infer_env

2、安装

安装所需的依赖项:

复制代码
pip install -r requirements.txt

3、准备评估数据

在项目根目录下创建一个名为 eval_data/ 的文件夹。

将您的QA文件以JSON格式放置在这个目录中,例如 eval_data/example.json。

每一行必须是一个包含以下两个键的 JSON 对象:

json 复制代码
{"question": "...","answer": "..."}

在 eval_data 文件夹中提供了一个示例文件供参考。

如果你计划使用文件解析器工具, 需将文件名添加到问题字段前 ,并将引用的文件放置在 eval_data/file_corpus/ 目录内。

4、配置推理脚本

打开 run_react_infer.sh,并按照注释中的说明修改以下变量:

MODEL_PATH - 本地或远程模型权重的路径。

DATASET - 评估集的路径,例如 example。

OUTPUT_PATH - 用于保存预测结果的路径,例如 ./outputs。

根据您启用的工具(检索、计算器、网络搜索等),提供所需的 API_KEY、BASE_URL 或其他凭证。每个密钥在 bash 脚本中均有内联说明。

5、运行推理脚本

复制代码
bash run_react_infer.sh

这种开放的态度,对于整个AI社区的推动作用是巨大的。毕竟,只有更多人参与进来,这个技术才能更快进化,应用场景也能更广。

谢谢你看我的文章,既然看到这里了,如果觉得不错,随手点个赞、转发、在看三连吧,感谢感谢。那我们,下次再见。

您的一键三连,是我更新的最大动力,谢谢

山水有相逢,来日皆可期,谢谢阅读,我们再会

我手中的金箍棒,上能通天,下能探海

相关推荐
晨非辰20 小时前
Linux权限管理速成:umask掩码/file透视/粘滞位防护15分钟精通,掌握权限减法与安全协作模型
linux·运维·服务器·c++·人工智能·后端
毕设源码-钟学长1 天前
【开题答辩全过程】以 基于SpringBoot的智能书城推荐系统的设计与实现为例,包含答辩的问题和答案
java·spring boot·后端
青春男大1 天前
Redis和RedisTemplate快速上手
java·数据库·redis·后端·spring·缓存
张张努力变强1 天前
C++ 类和对象(四):const成员函数、取地址运算符重载全精讲
开发语言·数据结构·c++·后端
不吃香菜学java1 天前
springboot左脚踩右脚螺旋升天系列-整合开发
java·spring boot·后端·spring·ssm
奋进的芋圆1 天前
Java 锁事详解
java·spring boot·后端
郑州光合科技余经理1 天前
技术架构:海外版外卖平台搭建全攻略
java·大数据·人工智能·后端·小程序·架构·php
科威舟的代码笔记2 天前
SpringBoot配置文件加载顺序:一场配置界的权力游戏
java·spring boot·后端·spring
血小板要健康2 天前
Spring IoC & DI (下)
java·前端·spring boot·后端·spring·servlet·java-ee
PP东2 天前
Flowable学习(一)——spring boot 部署
后端·学习·flowable