AI知识库集问答

框架图

架构图(模块视角)

当前真实生效路径(精简图)


"知识库"模块,当前实现可以概括为:文档管理 + 上下文拼接式问答(非RAG检索库),主问答链路是 单智能体调用 DeepSeek。

先说结论(你关心的点)

  • 用了哪个智能体

    • 问答时实际使用的是 AutoGen 的 AssistantAgent,名称是 knowledge_base_qa(在 backend/app/api/v1/endpoints/knowledge_base.py 里创建)。
    • 代码里虽然 import 了 RagRetrievalAgentStreamResponseCollectorRagRetrievalRequest/Response,但当前文件内没有实际调用,属于"预留/未接入"。
  • 调用了哪些模块

    • 路由与业务:backend/app/api/v1/endpoints/knowledge_base.py
    • 文件解析:app.utils.file_parserparse_pdf / parse_docx / parse_xmind / extract_text_from_xmind
    • 数据库模型:KnowledgeBaseDocumentKnowledgeBaseQARequirementTestCase
    • LLM客户端:app.core.llms.get_deepseek_model_client
    • 前端API层:frontend/src/api/knowledgeBase.ts
  • 用了什么大模型

    • 当前问答统一走 get_deepseek_model_client(timeout=20),底层模型是 deepseek-chat
    • 应用层又包了一层 asyncio.wait_for(..., timeout=25),避免前端长时间"正在生成"。

运行机制(知识库问答)

POST /api/v1/knowledge-base/qa 的处理逻辑是:

  1. 从数据库取三类内容:
    • 已上传知识库文档(KnowledgeBaseDocument
    • 已审批需求(Requirement
    • 测试用例的源文件路径(TestCase.source_file_path
  2. 解析/抽取文本后做上下文构建:
    • 关键词提取(中文词组、英文缩写、业务术语、数字)
    • 文档片段筛选与截断(总上下文预算 KB_QA_MAX_CONTEXT = 6000
  3. 组装 system_message + user_message(context+问题)
  4. AssistantAgent(knowledge_base_qa) 调 DeepSeek。
  5. 返回答案,并将问答记录写入 KnowledgeBaseQA
相关推荐
迁旭2 分钟前
claude code 规划模式(Plan Mode)完整指南
人工智能·机器学习·文心一言·知识图谱
user29876982706542 分钟前
七、Git Worktree:为什么隔离工作空间很重要
人工智能
八月瓜科技5 分钟前
豆包启动付费会员测试,承诺基础服务永久免费,免费AI时代是否终结?
数据库·人工智能·科技·深度学习·机器人
Jiude8 分钟前
经验正在失去垄断性
人工智能·架构·设计
海域云-罗鹏11 分钟前
豆包开启付费订阅,想白嫖越来越难了,企业不如部署自己的算力服务器
服务器·人工智能·github
战族狼魂11 分钟前
AI技术发展动态与行业趋势分析
人工智能
TTGGGFF15 分钟前
自动化天塌了?AI 替你画 Simulink!Agent——MCP 配置踩坑指南(附真实环境实测)
人工智能·自动化·simulink
njsgcs19 分钟前
每一轮对话都要求ai写入一次记忆,每5轮都要求ai选一个记忆遗忘
人工智能
Bruce_Liuxiaowei21 分钟前
AI投毒产业链曝光:安全工程师怎么看、怎么防
人工智能·安全·ai·投毒
枫夜求索阁25 分钟前
五一节后复工与AI技能管理的再思考:从手动操作迈向系统化
人工智能