技术栈
深度研究
Nicolas893
12 小时前
大模型
·
强化学习
·
深度搜索
·
r1
·
深度研究
·
search-r1
·
深度检索增强
【大模型理论篇】Search-R1: 通过强化学习训练LLM推理与利⽤搜索引擎
最近基于强化学习框架来实现大模型在推理和检索能力增强的项目很多,也是Deep Research技术持续演进的缩影。之前我们讨论过《R1-Searcher:通过强化学习激励llm的搜索能⼒》,今天我们分析下Search-R1【1】。
Nicolas893
4 天前
大模型
·
agent
·
强化学习
·
智能体
·
深度检索
·
深度研究
·
deepresearcher
【大模型理论篇】DeepResearcher论文分析-通过在真实环境中的强化学习实现深度研究
大模型(LLMs)配合网络搜索功能已经展现出在深度研究任务中的巨大潜力。然而,目前的方法主要依赖两种途径: