深度研究

木亦汐丫21 天前
rag·智能体·grpo算法·深度研究·deepresearcher·deepresearch·端到端强化学习
【大模型系列篇】深度研究智能体技术演进:从DeepResearch到DeepResearcher,如何重构AI研究范式DeepResearch 的概念与功能最早由 Google 在 Gemini 系列产品中推出,用于自动化生成结构化研究报告,近期底层依赖模型Gemini升级到了2.5 Pro。而我们常规认知的DeepResearch是由OpenAI推出的一款由优化版的 o3 模型驱动专注于深度研究和分析的AI智能体产品。其主要功能包括自主分析复杂的专业信息,实时查找和综合数百个在线资源,最终生成一份专业水准的完整报告。DeepResearch能够运用推理能力,在互联网上搜索、解读和分析海量的文本、图像和PDF文件,并根据
Nicolas89322 天前
大模型·强化学习·深度搜索·r1·深度研究·search-r1·深度检索增强
【大模型理论篇】Search-R1: 通过强化学习训练LLM推理与利⽤搜索引擎最近基于强化学习框架来实现大模型在推理和检索能力增强的项目很多,也是Deep Research技术持续演进的缩影。之前我们讨论过《R1-Searcher:通过强化学习激励llm的搜索能⼒》,今天我们分析下Search-R1【1】。
Nicolas89325 天前
大模型·agent·强化学习·智能体·深度检索·深度研究·deepresearcher
【大模型理论篇】DeepResearcher论文分析-通过在真实环境中的强化学习实现深度研究大模型(LLMs)配合网络搜索功能已经展现出在深度研究任务中的巨大潜力。然而,目前的方法主要依赖两种途径: