辅助查询是根据查询到的文档片段再去生成新的查询问题

💡 辅助查询是怎么来的?

它是基于你当前查询(query)检索到的某个文档片段(chunk_result),再去"反推"出新的相关问题(utility queries),这些问题的作用是:

  • 引导系统从更多角度理解这个文档;
  • 为后续推理、回答或补充背景知识做准备。

🧠 举个非常贴近实际的例子:

假设你问的是:

"公司的治理结构是怎样的?"

系统用这个问题去检索文档,拿到了以下 chunk_result

"根据公司章程,公司治理结构包括股东大会、董事会、监事会和高级管理层,各自职责如下......"

接着,系统会调用:

python 复制代码
utility_queries = self.utility_query_generator.generate_queries(
    chunk=str(chunk_result),     # 传入文档片段内容
    max_queries=2,
    existing_graph_queries=...
)

🔍 那这个 generate_queries 做的事,就是用语言模型或者类似的规则模板,生成类似这样的问题:

  • "董事会的职责有哪些?"
  • "高级管理层如何履行监督义务?"
  • "治理结构中的监事会作用是什么?"

👉 所以,它的目标是"站在系统的视角",主动提出更多细化问题,把这个 chunk 挖得更深。


🚨 注意:它不是基于原始用户提问,而是基于"当前文档片段"

虽然初始用户提问是引发这一切的触发点,但 辅助查询其实是"chunk 驱动"的,而不是"query 驱动的"。

也就是说:

原始用户问题 → 检索出 chunk → 系统看了 chunk 后自己想出的新问题


🧭 为什么这么设计?有啥好处?

这其实是一种很聪明的"文档自我探索机制":

优势 说明
💡 自动挖掘潜在知识 哪怕用户没问,系统也能主动发现重要内容
🔄 扩展语义图谱 生成的 utility query 可以丰富知识图谱、内存
🤖 改进推理表现 为后续 LLM 回答时提供更多上下文依据
🧠 有助记忆召回 作为补充 query 被记录,以备后续召回

✅ 总结一句话:

辅助查询是系统基于已检索文档片段,自动生成的新问题,用来更深入理解文档内容。

相关推荐
美狐美颜sdk2 小时前
直播美颜SDK特效功能实战:从API调用到效果调优的全过程
人工智能·1024程序员节·美颜sdk·直播美颜sdk·第三方美颜sdk
sali-tec5 小时前
C# 基于halcon的视觉工作流-章56-彩图转云图
人工智能·算法·计算机视觉·c#
梦想画家5 小时前
基于PyTorch的时间序列异常检测管道构建指南
人工智能·pytorch·python
Elastic 中国社区官方博客6 小时前
在 Elasticsearch 中使用 Mistral Chat completions 进行上下文工程
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
一碗绿豆汤6 小时前
机器学习第二阶段
人工智能·机器学习
用什么都重名6 小时前
DeepSeek-OCR 深度解析
人工智能·ocr·deepseek-ocr
河南骏7 小时前
RAG_检索进阶
人工智能·深度学习
灯火不休时8 小时前
95%准确率!CNN交通标志识别系统开源
人工智能·python·深度学习·神经网络·cnn·tensorflow
mit6.8248 小时前
[手机AI开发sdk] Aid_code IDE | PC浏览器同步访问
ide·人工智能·智能手机
deephub8 小时前
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
服务器·人工智能·python·大语言模型·mcp