langchain_chatchat+ollama部署本地知识库,联网查询以及对数据库(Oracle)数据进行查询

langchain_chatchat+ollama部署本地知识库,联网查询以及对数据库(Oracle)数据进行查询

涉及的内容其实挺多的,所以尽量减少篇幅

目录

准备工作:

部署ollama,并拉取qwen2.5:14b和quentinz/bge-large-zh-v1.5:latest

部署langchain_chatchat

部署oracle数据库

部署ollama以及拉取模型

可以参考下面的文章:
https://www.cnblogs.com/jokingremarks/p/18151827

部署langchain_chatchat

Langchain_chatchat的github路径:https://github.com/chatchat-space/Langchain-Chatchat

使用vscode快速创建一个venv虚拟环境管理工具

在当前环境下直接下载Langchain-Chatchat的python库

注意:这个只能在Python 3.8-3.11的环境下,不然会报错

Langchain-Chatchat 提供以 Python 库形式的安装方式,具体安装请执行:
pip install langchain-chatchat -U

如果要用Xinference接入Langchain-Chatchat,建议使用如下安装方式:
pip install "langchain-chatchat[xinference]" -U

本文使用ollama作为本地模型的调用,所以不需要装Xinference

部署oracle数据库

这里我是直接下载到了本地,使用的版本是Oracle 19c,安装教程网上大把,记得创建一个数据库,我这里数据库名字是orcl

对langchain-chatchat的配置文件初步调整:

首先先调整model_settings.yaml

DEFAULT_LLM_MODEL和DEFAULT_EMBEDDING_MODEL,将其替换成ollama下载下来的模型名,这里我们使用qwen2.5:14b作为LLM,使用quentinz/bge-large-zh-v1.5:latest作为Embedding

复制代码
# 默认选用的 LLM 名称
DEFAULT_LLM_MODEL: qwen2.5:14b

# 默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: quentinz/bge-large-zh-v1.5:latest

MODEL_PLATFORMS部分只保留ollama,同时修改内容

复制代码
llm_models:
      - qwen2.5:14b
embed_models:
      - quentinz/bge-large-zh-v1.5:latest

langchain-chatchat执行:

详细内容可以查看文档:https://github.com/chatchat-space/Langchain-Chatchat

其实就三步

执行初始化

chatchat init

初始化知识库

chatchat kb -r

启动项目

chatchat start -a

一般会自动跳到浏览器里面,地址为http://127.0.0.1:8501/

langchain-chatchat简单操作:

模型对话,就是最基础的对话操作,启用agent的时候可以选择不同的工具来进行对话

RAG对话,可以选择不同的场景进行对话,其中有知识库问答,文件对话和搜索引擎问答

知识库问答就是使用项目路径下的文件内容回答,会有些自带的文件在里面,可以自己上传

文件对话就是基于上传的文件内容进行问答

搜索引擎对话后面会有补充,需要对配置文件再进行调整

知识库管理,即对项目中的内部知识库进行增删知识库以及重建向量库

langchain-chatchat联网查询:

如果使用duckduckgo作为搜索引擎的话可能需要FQ,这个就自行解决了

先安装duckduckgo-search

pip install -U duckduckgo-search

将tool_settings.yaml中的search_internet的search_engine_name设置成duckduckgo

如果要查询天气或者地图相关的,可以增加用高德地图的配置,api可以直接去高德申请,比较容易

将kb_settings.yaml中的DEFAULT_SEARCH_ENGINE也修改成duckduckgo

重新加载项目以后,就可以使用搜索引擎对话了

langchain-chatchat连接oracle数据库并查询内容:

官方文档:https://github.com/chatchat-space/Langchain-Chatchat/blob/master/docs/install/README_text2sql.md

首先我们找到tool_settings.yaml中的text2sql进行修改

有几个需要注意的地方

oracle的连接我使用的是oracledb,所以需要安装oracledb

python -m pip install oracledb

table_comments是一些提示用的,如果发现模型形成的sql老是找不对表或者字段,就在里面说明下,准确率会大幅提高

重要的!!!最重要的!!!

因为oracle的语法比较特殊,所以要对langchain的源码进行修改

找到项目中的/envs/chat_0.3.1/lib/python3.11/site-packages/langchain_experimental/sql/base.py

在其中对SQL进行一些处理,目前我遇到的情况有如下的,都需要重新分割处理才行

复制代码
if "sql" in sql_cmd:
            sql_cmd = sql_cmd.split("sql")[-1].strip() # 增加的sql过滤,按照sql分割,取后一段,为了去掉```sql的开头
if "`" in sql_cmd:
            sql_cmd = sql_cmd.split("`")[0].strip() # 增加的sql过滤,按照sql分割,取后一段,为了去掉```的结尾
if "LIMIT" in sql_cmd:
            sql_cmd = sql_cmd.split("LIMIT")[0].strip() # 增加的sql过滤,按照sql分割,取后一段,为了去掉LIMIT

然后重新运行项目,选择启用agent并选择数据库对话,输入要搜索的东西,终端里面可以看到对应的sql以及查询结果

可以看到回答的和数据库中查询的内容一致

不过对Oracle数据库好像不是很友好,有时候还是会有一些奇怪的报错

以上

相关推荐
袁气满满~_~2 小时前
Python数据分析学习
开发语言·笔记·python·学习
axinawang2 小时前
二、信息系统与安全--考点--浙江省高中信息技术学考(Python)
python·浙江省高中信息技术
寻星探路2 小时前
【算法专题】滑动窗口:从“无重复字符”到“字母异位词”的深度剖析
java·开发语言·c++·人工智能·python·算法·ai
Dxy12393102162 小时前
python连接minio报错:‘SSL routines‘, ‘ssl3_get_record‘, ‘wrong version number‘
开发语言·python·ssl
吨吨不打野2 小时前
CS336——2. PyTorch, resource accounting
人工智能·pytorch·python
___波子 Pro Max.2 小时前
Python文件读取代码中strip()的作用
python
pumpkin845143 小时前
Go 学习全景引子:理解设计理念与工程思路
python·学习·golang
weixin_462446233 小时前
从零开始:基于 Python PyQt5 打造多功能音乐播放器 | 支持播放、暂停、进度控制与歌词同步
python·音乐播放器·pyqt5
小二·3 小时前
Python Web 开发进阶实战:安全加固实战 —— 基于 OWASP Top 10 的全栈防御体系
前端·python·安全
唐叔在学习3 小时前
还在申请云服务器来传输数据嘛?试试P2P直连吧
后端·python