LLM大语言模型私有化部署-使用Dify的工作流编排打造专属AI搜索引擎

背景

上一篇文章介绍了如何使用 OllamaDify 搭建个人 AI 助手。首先通过 Ollama 私有化部署了 Qwen2.5 (7B) 模型,然后使用 Docker Compose 一键部署了 Dify 社区版平台。在 Dify 平台上,通过普通编排 的方式,创建了基于 Qwen2.5 模型的聊天助手,并添加了个人知识库作为上下文,实现了真正的个人助手功能。

今天我们使用 Dify 提供的工作流编排 以及 Dify 自带的 Tavily Search 搜索工具、 LLM 模型 Qwen2.5 (7B) 模型实现自己的AI搜索引擎

打造自己专属的AI搜索引擎

新建工作流编排聊天助手

新建一个"聊天助手"类型的应用,编排方法选择"工作流编排"。

生成默认布局

进入编排页面之后,默认生成了一个带有开始和介绍节点,中间有个 LLM 的节点(自动选择了我们的默认模型 Qwen2.5 )的默认布局,这就相当于工作流版的基础个人助手。

添加Tavily Search搜索工具节点

LLM 节点前面,增加一个搜索工具节点(通过前一个节点的 + ,在弹窗里的"工具"Tab下找到搜索工具),这里选择 Tavily Search

注册获取Tavily Search授权

Tavily Search 需要授权后才能使用,通过"如何获取"超链接跳转到 Tavily Search 官方进行注册登录,我这里使用 GitHub 账号直接登录,之后可以获取到一个 API Key ,一个月有1000的免费次数。


配置Tavily Search搜索工具节点输入

作为搜索引擎, Tavily Search 需要接收用户的输入(sys.query)作为参数,最后将结果(text)返回。

Note:输入、输出参数可以通过输入 / 进行选择。

配置LLM节点的系统提示词

在LLM节点,键入/选择 Tavily Search 的输出 text ,编辑系统提示词 Prompt

根据搜索引擎返回的结果:{{#1734574383345.text#}},回答用户问题。


通过上述步骤,一个简版 AI 搜索引擎搭建完毕,我们进行预览测试:输入问题"看下Black Forest Labs的最新消息"。

查看对话日志

在回答处有个"查看日志"按钮,点击查看详细的对话日志。

而且可以对每个节点进行跟踪记录查看,包含了每一步的输入与输出,方便调试。

问几个新闻问题试试

我问了近期发生的事情,可以看到这个 AI 助手基本都看可以正常回答。

  1. 微信可以送礼物了?
  2. 人贩子余华英重审二审什么结果?

遇到的问题

大模型无法成功应用搜索引擎返回的信息

当我问了"今天太原天气怎样"的问题后,最后竟然返回:很抱歉,作为人工智能,我无法提供实时信息。。

什么?我专门给你配了可以联网的搜索引擎,你跟我说无法提供实时信息??

经过节点跟踪排查之后,我发现,其实 Tavily Search 搜索工具节点已经查到了相关信息,但是到了 LLM 节点,并没有真正使用到搜索引擎的返回信息。

经过分析之后,我尝试在 LLM 节点增加了上下文,并修改了系统提示词:

根据后面这部分内容:{{#context#}},来回答用户问题

再次尝试相同的问题,看模型如何回答。这次成功回复了我们问题。

大模型不能很好地理解相对时间,eg: 今天、昨天

上面对于天气情况的回答,看似没问题,其实多问几次就会发现,模型不能很好地理解相对时间,eg: 今天、昨天、去年。这个问题可以通过 Dify 提供的 Time 相关工具,再借助 Dify 的智能体 Agent 来解决,目前我还没有进行验证。

其他功能

其他功能,诸如对话开场白下一步问题建议 以及内容审查功能可以根据自己的需求进行发挥。

小总结

本文通过组合 Dify 的工作流编排、 Tavily Search 搜索引擎工具以及 Qwen2.5 模型,成功实现了一个能够回答实时问题的 AI 搜索引擎,步骤详细,极具可操作性。后续想办法解决模型对相对时间(今天、昨天、去年等)的理解存在局限性。这个 AI 搜索引擎能够回答一些实时新闻和事件相关的问题,展示了 Dify 工作流编排功能的便捷性、实用性。

Reference


If you have any questions or any bugs are found, please feel free to contact me.

Your comments and suggestions are welcome!

相关推荐
云起无垠2 小时前
【论文速读】| FirmRCA:面向 ARM 嵌入式固件的后模糊测试分析,并实现高效的基于事件的故障定位
人工智能·自动化
Leweslyh4 小时前
物理信息神经网络(PINN)八课时教案
人工智能·深度学习·神经网络·物理信息神经网络
love you joyfully4 小时前
目标检测与R-CNN——pytorch与paddle实现目标检测与R-CNN
人工智能·pytorch·目标检测·cnn·paddle
该醒醒了~4 小时前
PaddlePaddle推理模型利用Paddle2ONNX转换成onnx模型
人工智能·paddlepaddle
小树苗1934 小时前
DePIN潜力项目Spheron解读:激活闲置硬件,赋能Web3与AI
人工智能·web3
凡人的AI工具箱5 小时前
每天40分玩转Django:Django测试
数据库·人工智能·后端·python·django·sqlite
大多_C5 小时前
BERT outputs
人工智能·深度学习·bert
Debroon5 小时前
乳腺癌多模态诊断解释框架:CNN + 可解释 AI 可视化
人工智能·神经网络·cnn
反方向的钟儿5 小时前
非结构化数据分析与应用(Unstructured data analysis and applications)(pt3)图像数据分析1
人工智能·计算机视觉·数据分析