技术栈

search-r1

Nicolas893
2 个月前
大模型·强化学习·深度搜索·r1·深度研究·search-r1·深度检索增强
【大模型理论篇】Search-R1: 通过强化学习训练LLM推理与利⽤搜索引擎最近基于强化学习框架来实现大模型在推理和检索能力增强的项目很多,也是Deep Research技术持续演进的缩影。之前我们讨论过《R1-Searcher:通过强化学习激励llm的搜索能⼒》,今天我们分析下Search-R1【1】。