辅助查询是根据查询到的文档片段再去生成新的查询问题

💡 辅助查询是怎么来的?

它是基于你当前查询(query)检索到的某个文档片段(chunk_result),再去"反推"出新的相关问题(utility queries),这些问题的作用是:

  • 引导系统从更多角度理解这个文档;
  • 为后续推理、回答或补充背景知识做准备。

🧠 举个非常贴近实际的例子:

假设你问的是:

"公司的治理结构是怎样的?"

系统用这个问题去检索文档,拿到了以下 chunk_result

"根据公司章程,公司治理结构包括股东大会、董事会、监事会和高级管理层,各自职责如下......"

接着,系统会调用:

python 复制代码
utility_queries = self.utility_query_generator.generate_queries(
    chunk=str(chunk_result),     # 传入文档片段内容
    max_queries=2,
    existing_graph_queries=...
)

🔍 那这个 generate_queries 做的事,就是用语言模型或者类似的规则模板,生成类似这样的问题:

  • "董事会的职责有哪些?"
  • "高级管理层如何履行监督义务?"
  • "治理结构中的监事会作用是什么?"

👉 所以,它的目标是"站在系统的视角",主动提出更多细化问题,把这个 chunk 挖得更深。


🚨 注意:它不是基于原始用户提问,而是基于"当前文档片段"

虽然初始用户提问是引发这一切的触发点,但 辅助查询其实是"chunk 驱动"的,而不是"query 驱动的"。

也就是说:

原始用户问题 → 检索出 chunk → 系统看了 chunk 后自己想出的新问题


🧭 为什么这么设计?有啥好处?

这其实是一种很聪明的"文档自我探索机制":

优势 说明
💡 自动挖掘潜在知识 哪怕用户没问,系统也能主动发现重要内容
🔄 扩展语义图谱 生成的 utility query 可以丰富知识图谱、内存
🤖 改进推理表现 为后续 LLM 回答时提供更多上下文依据
🧠 有助记忆召回 作为补充 query 被记录,以备后续召回

✅ 总结一句话:

辅助查询是系统基于已检索文档片段,自动生成的新问题,用来更深入理解文档内容。

相关推荐
uesowys2 小时前
Apache Spark算法开发指导-Factorization machines classifier
人工智能·算法
人工智能AI技术2 小时前
预训练+微调:大模型的“九年义务教育+专项补课”
人工智能
aircrushin2 小时前
中国多模态大模型历史性突破:智源Emu3自回归统一范式技术深度解读
人工智能
Lsx_2 小时前
前端视角下认识 AI Agent 和 LangChain
前端·人工智能·agent
aiguangyuan2 小时前
使用LSTM进行情感分类:原理与实现剖析
人工智能·python·nlp
Yeats_Liao3 小时前
评估体系构建:基于自动化指标与人工打分的双重验证
运维·人工智能·深度学习·算法·机器学习·自动化
深圳市恒星物联科技有限公司3 小时前
水质流量监测仪:复合指标监测的管网智能感知设备
大数据·网络·人工智能
断眉的派大星3 小时前
均值为0,方差为1:数据的“标准校服”
人工智能·机器学习·均值算法
A尘埃3 小时前
电子厂PCB板焊点缺陷检测(卷积神经网络CNN)
人工智能·神经网络·cnn
Tadas-Gao3 小时前
缸中之脑:大模型架构的智能幻象与演进困局
人工智能·深度学习·机器学习·架构·大模型·llm