Windows 部署ChatGLM3大语言模型

一、环境要求

硬件

内存:>= 16GB

显存: >= 13GB(4080 16GB)

硬盘:60G

软件

python 版本推荐3.10 - 3.11

transformers 库版本推荐为 4.36.2

torch 推荐使用 2.0 及以上的版本,以获得最佳的推理性能

二、部署步骤

1、新建python3.10虚拟环境

使用pycharm建虚拟环境

2、设置镜像源

bash 复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

3、升级pip

bash 复制代码
python -m pip install --upgrade pip

4、安装项目依赖

bash 复制代码
pip install -r requirements.txt

5、安装Demo依赖

bash 复制代码
pip install -r composite_demo/requirements.txt

6、下载模型

安装git-lfs

sudo apt-get install git-lfs

bash 复制代码
git clone https://huggingface.co/THUDM/chatglm3-6b

如果从 HuggingFace 下载比较慢,也可以从 ModelScope 中下载。

bash 复制代码
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

7、运行demo

bash 复制代码
streamlit run basic_demo/web_demo_streamlit.py

相关推荐
梨轻巧5 分钟前
pyside6安装:下载python、配置环境变量、vscode安装和测试pyside6、可能遇到的错误、pycharm 安装pyside6
python
关关长语10 分钟前
(四) Dotnet中MCP客户端与服务端交互通知日志信息
ai·c#·mcp
wu_jing_sheng017 分钟前
电商销售数据分析实战:从数据挖掘到业务增长
python
voice67021 分钟前
西电现代密码学实验一
开发语言·python·密码学
FriendshipT21 分钟前
图像生成:PyTorch从零开始实现一个简单的扩散模型
人工智能·pytorch·python
糖炒狗子36 分钟前
基于 OpenVINO 实现 SpeechT5 语音合成模型本地部署加速
人工智能·ai·语音合成·openvino
初学小白...1 小时前
反射概述and获得反射对象
开发语言·python
后藤十八里1 小时前
2025python学习笔记Part2
开发语言·python
寒秋丶1 小时前
Milvus:向量字段-二进制向量、稀疏向量与密集向量(六)
数据库·人工智能·python·ai·ai编程·milvus·向量数据库
寒秋丶1 小时前
Milvus:通过Docker安装Milvus向量数据库(一)
数据库·人工智能·docker·ai·ai编程·milvus·rag