Dify框架下的基于RAG流程的政务检索平台

项目需求:

项目需要实现对于41个公司规章制度文件的检索,输出检索出自文件名称、命中的问题答案内容,并且保证原始规章制度的格式输出,不允许加工修改。

项目方案:

模型使用DeepSeek-R1-70B基于ollama搭建,平台基于Dify搭建,RAG基于Dify中成熟的流程引擎实现。对于用户的提问首先进行知识库检索,输出的内容分2个分支,第一个分支进入LLM大模型,第二个分支进入代码执行模块提取出出处标题和内容。两个分支同时进入变量聚合器实现2个分支结果的合并,最终进入结束节点,输出最终结果。

提示词prompt:

复制代码
你是一个系统助手,使用以下内容作为你学习的知识。

<context>

</context>

回答用户的问题时,如果在知识库中可以找到与问题最相关的原文,就输出原文内容;如果在知识库中找不到,就说不知道。

知识库构建:

在知识库的构建过程中,文章分段采用通用的分段模式,分段最大长度4000,重叠长度50。然后人工对人段结果进行修正微调。索引模式采用向量检索+全文检索这样的混合检索模式,其中向量检索Embedding 模型使用bge-large-zh-v1.5,排序Rerank 模型使用bge-reranker-large模型,其他参数TopK设置为0,阈值为0.7。

相关推荐
JosieBook22 分钟前
【人工智能】人工智能在企业中的应用
人工智能
技术与健康1 小时前
LLM实践系列:利用LLM重构数据科学流程04 - 智能特征工程
数据库·人工智能·重构
无风听海1 小时前
行向量和列向量在神经网络应用中的选择
人工智能·深度学习·神经网络·行向量·列向量
一点一木2 小时前
主流 AI 提示词优化工具推荐(2025 全面对比指南)
人工智能·openai·ai编程
全栈小52 小时前
【AI编程】如何快速通过AI IDE集成开发工具来生成一个简易留言板系统
ide·人工智能·ai编程
能力越小责任越小YA2 小时前
服务器(Linux)新账户搭建Pytorch深度学习环境
人工智能·pytorch·深度学习·环境搭建
小五1273 小时前
机器学习-线性回归
人工智能·机器学习
攻城狮7号3 小时前
昆仑万维开源 Matrix-3D大模型,正在开启“造物主”模式
人工智能·matrix-3d·昆仑万维开源大模型
A7bert7773 小时前
【YOLOv5部署至RK3588】模型训练→转换RKNN→开发板部署
c++·人工智能·python·深度学习·yolo·目标检测·机器学习
闲不住的李先森3 小时前
AI 应用演进:从基础调用到自主智能体
人工智能·llm·aigc