AI知识库集问答

框架图

架构图(模块视角)

当前真实生效路径(精简图)


"知识库"模块,当前实现可以概括为:文档管理 + 上下文拼接式问答(非RAG检索库),主问答链路是 单智能体调用 DeepSeek。

先说结论(你关心的点)

  • 用了哪个智能体

    • 问答时实际使用的是 AutoGen 的 AssistantAgent,名称是 knowledge_base_qa(在 backend/app/api/v1/endpoints/knowledge_base.py 里创建)。
    • 代码里虽然 import 了 RagRetrievalAgentStreamResponseCollectorRagRetrievalRequest/Response,但当前文件内没有实际调用,属于"预留/未接入"。
  • 调用了哪些模块

    • 路由与业务:backend/app/api/v1/endpoints/knowledge_base.py
    • 文件解析:app.utils.file_parserparse_pdf / parse_docx / parse_xmind / extract_text_from_xmind
    • 数据库模型:KnowledgeBaseDocumentKnowledgeBaseQARequirementTestCase
    • LLM客户端:app.core.llms.get_deepseek_model_client
    • 前端API层:frontend/src/api/knowledgeBase.ts
  • 用了什么大模型

    • 当前问答统一走 get_deepseek_model_client(timeout=20),底层模型是 deepseek-chat
    • 应用层又包了一层 asyncio.wait_for(..., timeout=25),避免前端长时间"正在生成"。

运行机制(知识库问答)

POST /api/v1/knowledge-base/qa 的处理逻辑是:

  1. 从数据库取三类内容:
    • 已上传知识库文档(KnowledgeBaseDocument
    • 已审批需求(Requirement
    • 测试用例的源文件路径(TestCase.source_file_path
  2. 解析/抽取文本后做上下文构建:
    • 关键词提取(中文词组、英文缩写、业务术语、数字)
    • 文档片段筛选与截断(总上下文预算 KB_QA_MAX_CONTEXT = 6000
  3. 组装 system_message + user_message(context+问题)
  4. AssistantAgent(knowledge_base_qa) 调 DeepSeek。
  5. 返回答案,并将问答记录写入 KnowledgeBaseQA
相关推荐
冬奇Lab4 小时前
大模型就是你雇的员工:从职场管理学看 AI 协作范式的三次进化
人工智能
璞华Purvar4 小时前
涂料行业数智化升级破局:璞华易研 PLM 以 AI 赋能研发全链路
大数据·人工智能
lulu12165440784 小时前
Claude Code Harness架构技术深度解析:生产级AI Agent工程化实践
java·人工智能·python·ai编程
碧海银沙音频科技研究院4 小时前
1-1杰理蓝牙SOC的UI配置开发方法
人工智能·深度学习·算法
珂朵莉MM5 小时前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第3赛季优化题--启发式算法+操作因子设计
人工智能·算法
Smoothcloud润云5 小时前
从“预测下一个词”到“预测下一个世界状态”:世界模型作为AGI新范式的深度分析报告
人工智能·测试工具·微服务·容器·github·状态模式·agi
Magic-Yuan5 小时前
用好AI的五个习惯
人工智能
石工记5 小时前
AI 应用开发新范式 MCP
人工智能
360亿方智能5 小时前
行业领先!360AI多模态知识库深度集成前沿技术,精准对齐图、文、视跨模态知识
人工智能