搭建 Langchain-Chatchat 详细过程


本文参考官网和其他多方教程,将搭建 Langchain-Chatchat 的详细步骤进行了整理,供大家参考。


  • 4090 显卡
  • win10 专业版本

搭建环境使用 chatglm2-6b 模型

1. 创建虚拟环境 chatchat ,python 3.9 以上

ini 复制代码
conda create -n chatchat python=3.10

2. 激活环境

conda activate chatchat

3. 在自己选好的目录下拉取仓库

bash 复制代码
git clone https://github.com/chatchat-space/Langchain-Chatchat.git

4. 安装所需要的依赖

less 复制代码
pip.exe install -r requirements.txt (使用清华源应该能加速下载 -i https://pypi.tuna.tsinghua.edu.cn/simple)

5. 安装 pytorch ,进入 https://pytorch.org/get-started/previous-versions/ 页面搜索 11.6(这是我的 cuda 版本),即可找到对应版本的下载命令

ini 复制代码
pip.exe install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

6. 拉取 chatglm2-6b 模型(需要配置好 VPN )

bash 复制代码
git clone https://huggingface.co/THUDM/chatglm2-6b (如果网络稳定应该可以成功下载,如果不稳定,直接去页面点击各个模型进行下载,然后放到指定的目录中即可,反正原则就是将网页的文件都下载到本地目录即可)	

7. 拉取 m3e 模型(这个和上面同样的操作)

bash 复制代码
git clone https://huggingface.co/moka-ai/m3e-base

如果 git 拉取代码的时候报下面的错 Failed to connect to huggingface.co port 443 after 21045 ms: Couldn't connect to server ,将 git 的代理重新设置一下,然后尝试重新 clone 。

arduino 复制代码
git config --global http.proxy
git config --global https.proxy

8. 将 Langchain-Chatchat/configs 下面的所有以 .example 结尾的文件都复制一份,将原文件名结尾的 .example 去掉,这样得到所有的新文件就是 py 文件,如图所示。下面的 model_config.py 文件需要特殊处理,其他的文件使用默认配置。

9. model_config.py 中的配置需要修改,配置 m3e 和 chatglm2-6b 的模型的绝对路径

less 复制代码
MODEL_PATH['embed_model']['m3e-base'] 改为自己存放 m3e 的绝对路径 'D:\\m3e-base'
MODEL_PATH['llm_model']['chatglm2-6b'] 改为自己存放 chatglm2-6b 的绝对路径 'D:\\chatglm2-6b'
TEMPERATURE 不建议过高,如果是 Agent 对话或者知识库问答,强烈建议设置为接近 0 或者 0

同样的道理,如果你使用其他的模型如 chatglm3-6b ,那么就提前将 huggingface 中的 chatglm3-6b 项目下载到本地,然后在 MODEL_PATH["llm_model"] 中仿照上下文的格式新增一行内容,配置好绝对路径即可。如果想在启动的时候使用 chatglm3-6b 要把 LLM_MODEL 参数改为 chatglm3-6b 即可。

10. 初始化知识库

css 复制代码
python.exe init_database.py --recreate-vs


arduino 复制代码
    database talbes reseted
    recreating all vector stores
    2023-11-08 19:08:33,030 - faiss_cache.py[line:75] - INFO: loading vector store in 'samples/vector_store' from disk.
    2023-11-08 19:08:33,100 - SentenceTransformer.py[line:66] - INFO: Load pretrained SentenceTransformer: D:\m3e-base
    2023-11-08 19:08:33,560 - loader.py[line:54] - INFO: Loading faiss with AVX2 support.
    2023-11-08 19:08:33,560 - loader.py[line:58] - INFO: Could not load library with AVX2 support due to:
    ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")
    2023-11-08 19:08:33,560 - loader.py[line:64] - INFO: Loading faiss.
    2023-11-08 19:08:33,570 - loader.py[line:66] - INFO: Successfully loaded faiss.
    2023-11-08 19:08:33,580 - faiss_cache.py[line:75] - INFO: loading vector store in 'samples/vector_store' from disk.
    Batches: 100%|███████████████████████████████████████████████████████████████████████████| 1/1 [00:01<00:00,  1.08s/it]
    2023-11-08 19:08:34,821 - utils.py[line:287] - INFO: UnstructuredFileLoader used for D:\Langchain-Chatchat\knowledge_base\samples\content\test.txt

11. 启动项目,因为我的 20000 端口已经被占了,而且杀不掉所以重启电脑再启动项目

css 复制代码
python.exe .\startup.py -a


scss 复制代码
==============================Langchain-Chatchat Configuration==============================
python版本:3.10.13 | packaged by Anaconda, Inc. | (main, Sep 11 2023, 13:24:38) [MSC v.1916 64 bit (AMD64)]
langchain版本:0.0.331. fastchat版本:0.2.31
当前启动的LLM模型:['chatglm2-6b'] @ cuda
{'device': 'cuda',
 'host': '',
 'infer_turbo': False,
 'model_path': 'D:\\chatglm2-6b',
 'port': 20002}
当前Embbedings模型: m3e-base @ cuda
==============================Langchain-Chatchat Configuration==============================
2023-11-08 20:20:45,665 - startup.py[line:626] - INFO: 正在启动服务:
2023-11-08 20:20:45,665 - startup.py[line:627] - INFO: 如需查看 llm_api 日志,请前往 D:\Langchain-Chatchat\logs
2023-11-08 20:20:48 | ERROR | stderr | INFO:     Started server process [6772]
2023-11-08 20:20:48 | ERROR | stderr | INFO:     Waiting for application startup.
2023-11-08 20:20:48 | ERROR | stderr | INFO:     Application startup complete.
2023-11-08 20:20:48 | ERROR | stderr | INFO:     Uvicorn running on (Press CTRL+C to quit)
2023-11-08 20:20:48 | INFO | model_worker | Register to controller
2023-11-08 20:20:48 | INFO | model_worker | Loading the model ['chatglm2-6b'] on worker 928af55b ...
Loading checkpoint shards:   0%|                                                                 | 0/7 [00:00<?, ?it/s]
Loading checkpoint shards:  14%|████████▏                                                | 1/7 [00:01<00:06,  1.09s/it]
Loading checkpoint shards:  29%|████████████████▎                                        | 2/7 [00:02<00:05,  1.14s/it]
Loading checkpoint shards:  43%|████████████████████████▍                                | 3/7 [00:03<00:04,  1.11s/it]
Loading checkpoint shards:  57%|████████████████████████████████▌                        | 4/7 [00:04<00:03,  1.06s/it]
Loading checkpoint shards:  71%|████████████████████████████████████████▋                | 5/7 [00:05<00:02,  1.10s/it]
Loading checkpoint shards:  86%|████████████████████████████████████████████████▊        | 6/7 [00:06<00:01,  1.10s/it]
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████| 7/7 [00:07<00:00,  1.06it/s]
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████| 7/7 [00:07<00:00,  1.03s/it]
2023-11-08 20:20:56 | ERROR | stderr |
2023-11-08 20:20:58 | INFO | model_worker | Register to controller
INFO:     Started server process [23280]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on (Press CTRL+C to quit)
==============================Langchain-Chatchat Configuration==============================
python版本:3.10.13 | packaged by Anaconda, Inc. | (main, Sep 11 2023, 13:24:38) [MSC v.1916 64 bit (AMD64)]
langchain版本:0.0.331. fastchat版本:0.2.31
当前启动的LLM模型:['chatglm2-6b'] @ cuda
{'device': 'cuda',
 'host': '',
 'infer_turbo': False,
 'model_path': 'D:\\chatglm2-6b',
 'port': 20002}
当前Embbedings模型: m3e-base @ cuda
    OpenAI API Server:
    Chatchat  API  Server:
    Chatchat WEBUI Server:
==============================Langchain-Chatchat Configuration==============================
      Welcome to Streamlit!
      If you'd like to receive helpful onboarding emails, news, offers, promotions,
      and the occasional swag, please enter your email address below. Otherwise,
      leave this field blank.


vbnet 复制代码
You can find our privacy policy at https://streamlit.io/privacy-policy
  - This open source library collects usage statistics.
  - We cannot see and do not store information contained inside Streamlit apps,
    such as text, charts, images, etc.
  - Telemetry data is stored in servers in the United States.
  - If you'd like to opt out, add the following to %userprofile%/.streamlit/config.toml,
    creating that file if necessary:
    gatherUsageStats = false
  You can now view your Streamlit app in your browser.

12. 报错解决 ERROR: RemoteProtocolError: API通信遇到错误:peer closed connection without sending complete message body (incomplete chunked read)

ini 复制代码
使用 openai==0.28.1 即可解决问题

13. 报错解决

上传除了 csv 文件的其他文件都会报错,这个问题在 github.com/chatchat-sp... 也有,但是一直没有解决,目前只能处理 csv 文件了,看后续官方是否会解决:

sql 复制代码
{'base_url': '', 'timeout': 60.0, 'proxies': {'all://': None, 'all://localhost': None, '': None, 'http://': None, 'https://': None, 'all://': None, 'http://localhost': None}}
2023-11-10 17:36:15,387 - utils.py[line:287] - INFO: UnstructuredFileLoader used for D:\Langchain-Chatchat\knowledge_base\samples\content\sanguo.txt
2023-11-10 17:37:15,386 - utils.py[line:95] - ERROR: ReadTimeout: error when post /knowledge_base/update_docs: timed out
2023-11-10 17:37:15,405 - utils.py[line:287] - INFO: UnstructuredFileLoader used for D:\Langchain-Chatchat\knowledge_base\samples\content\sanguo.txt

14. 最终 python 库版本号

15. LLM 对话体验

这里使用的是 chatglm3-6b 模型,效果感觉一般。

16. 知识库问答体验

我将自己的数据做成 cvs 格式,然后导入到项目中。因为是知识库问答,所以 Temperature 要尽量调整到 0 附近,避免模型自由发挥。可以看出每个问题都能回答准确,这是让我满意的一点。如果点开"知识库匹配结果"可以看到准确的原文引用内容。





重新搭建环境使用 Baichuan2-13B-Chat-4bits 模型

1. 安装 11.8 的 cuda

https://pytorch.org/get-started/locally/ 中可以查看 pytorch 最高支持 11.8 cuda 版本,然后进入 https://developer.nvidia.com/cuda-toolkit-archive 找到 CUDA Toolkit 11.8 进行下载,下载结束之后双击基本上是傻瓜式下一步按钮即可,不懂的可以见参考中的链接。此时重新打开命令行,查看 nvcc -V 已经变成了 11.8 版本:

yaml 复制代码
    nvcc: NVIDIA (R) Cuda compiler driver
    Copyright (c) 2005-2022 NVIDIA Corporation
    Built on Wed_Sep_21_10:41:10_Pacific_Daylight_Time_2022
    Cuda compilation tools, release 11.8, V11.8.89
    Build cuda_11.8.r11.8/compiler.31833905_0

2. 创建支持 python=3.10 的虚拟环境 torch-2.x-py-3.10

先创建号支持 python 3.10 的虚拟环境,然后进行虚拟环境,在浏览器 pytorch.org/get-started... 页面中找到支持 CUDA 11.8 的 pytorch2.1 命令在虚拟环境中进行安装,然后安装项目所需的 requirements.txt 中的库,同上一样。

perl 复制代码
pip3.exe install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

3. 拉取 0.2.6 版本的项目,按照上面的步骤重新配置 Chatchat 项目中的各个文件中的配置

4. 初始化数据库

 python.exe .\init_database.py -r


5. 启动项目

css 复制代码
python.exe .\startup.py -a


6. 解决启动时候报错 AttributeError: 'BaichuanTokenizer' object has no attribute 'sp_model'

ini 复制代码
安装 transformers==4.33.2 

7. 解决启动报错 ImportError: Needs import model weight init func to run quantize.

ini 复制代码
安装 pip.exe install bitsandbytes==0.41.1

8. 解决启动时候报错 RuntimeError:

vbnet 复制代码
    CUDA Setup failed despite GPU being available. Please run the following command to get more information:
    python -m bitsandbytes
    Inspect the output of the command and see if you can locate CUDA libraries. You might need to add them to your LD_LIBRARY_PATH. If you suspect a bug, please take the information from python -m bitsandbytes and open an issue at: https://github.com/TimDettmers/bitsandbytes/issues

参考这里 github.com/TimDettmers... 中的答案。卸载 bitsandbytes 和 bitsandbytes-windows 库,然后编译包 bitsandbytes-0.41.1-py3-none-win_amd64.whl

ruby 复制代码
pip.exe uninstall bitsandbytes-windows bitsandbytes 
pip.exe install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.1-py3-none-win_amd64.whl

9. 最终 python 库版本号

