Dify框架下的基于RAG流程的政务检索平台

项目需求:

项目需要实现对于41个公司规章制度文件的检索,输出检索出自文件名称、命中的问题答案内容,并且保证原始规章制度的格式输出,不允许加工修改。

项目方案:

模型使用DeepSeek-R1-70B基于ollama搭建,平台基于Dify搭建,RAG基于Dify中成熟的流程引擎实现。对于用户的提问首先进行知识库检索,输出的内容分2个分支,第一个分支进入LLM大模型,第二个分支进入代码执行模块提取出出处标题和内容。两个分支同时进入变量聚合器实现2个分支结果的合并,最终进入结束节点,输出最终结果。

提示词prompt:

复制代码
你是一个系统助手,使用以下内容作为你学习的知识。

<context>

</context>

回答用户的问题时,如果在知识库中可以找到与问题最相关的原文,就输出原文内容;如果在知识库中找不到,就说不知道。

知识库构建:

在知识库的构建过程中,文章分段采用通用的分段模式,分段最大长度4000,重叠长度50。然后人工对人段结果进行修正微调。索引模式采用向量检索+全文检索这样的混合检索模式,其中向量检索Embedding 模型使用bge-large-zh-v1.5,排序Rerank 模型使用bge-reranker-large模型,其他参数TopK设置为0,阈值为0.7。

相关推荐
聚客AI38 分钟前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
BeerBear2 小时前
【保姆级教程-从0开始开发MCP服务器】一、MCP学习压根没有你想象得那么难!.md
人工智能·mcp
小气小憩2 小时前
“暗战”百度搜索页:Monica悬浮球被“围剿”,一场AI Agent与传统巨头的流量攻防战
前端·人工智能
神经星星2 小时前
准确度提升400%!印度季风预测模型基于36个气象站点,实现城区尺度精细预报
人工智能
IT_陈寒5 小时前
JavaScript 性能优化:5 个被低估的 V8 引擎技巧让你的代码快 200%
前端·人工智能·后端
惯导马工5 小时前
【论文导读】ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and
深度学习·算法
Juchecar5 小时前
一文讲清 PyTorch 中反向传播(Backpropagation)的实现原理
人工智能
黎燃5 小时前
游戏NPC的智能行为设计:从规则驱动到强化学习的演进
人工智能
机器之心6 小时前
高阶程序,让AI从技术可行到商业可信的最后一公里
人工智能·openai
martinzh6 小时前
解锁RAG高阶密码:自适应、多模态、个性化技术深度剖析
人工智能