快速在WIN11中本地部署chatGLM3

具体请看智谱仓库github:GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

或者Huggingface:https://huggingface.co/THUDM/chatglm3-6b

  1. 利用Anaconda建立一个虚拟环境:

    conda create -n chatglm3 python=3.11 (版本太低安装streamlit会出问题)
    conda activate chatglm3

  2. 安装torch的GPU版:

根据自己本地计算机显卡和系统选择官方上相应的指令:

复制代码
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

这块安装时间较长,耐心等待,反复尝试,直到安装成功为止。其中,需要测试一下GPU的CUDA功能是否可以正常使用:

复制代码
print(torch.version.cuda)	#查看cuda版本
print(torch.cuda.is_available())  # 查看cuda是否可用
print(torch.cuda.device_count())  # 查看可行的cuda数目

如果以上指令运行没问题,显示True,说明可以GPU可以正常使用。

3.开始安装ChatGLM3,根据以上官网地址的说明进行如下操作:

选择D盘或者其他盘建立一个本地文件,利用管理员权限打开一个cmd窗口运行如下命令:

复制代码
git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3

然后使用 pip 安装依赖:

复制代码
pip install -r requirements.txt

此外,使用 Code Interpreter 还需要安装 Jupyter 内核:

复制代码
ipython kernel install --name chatglm3-demo --user

然后,进入basic_demo目录下,实现三种新的样例测试

1)案例1------指令窗口

运行如下指令:

复制代码
python cli_demo.py

指令对话窗口案例2:

2) 案例2------Gradio

运行如下命令:

复制代码
python web_demo.py

注意:如果不输出结果,是由于Gradio的版本过高,建议安装pip install gradio==3.40版本。太低会报错,比如3.39版本。

  1. 案例3------streamlit

运行如下命令:

复制代码
streamlit run web_demo2.py

其中,需要修改一下路径,将下载好的模型放到本目录下,将第6行程序改为

复制代码
将MODEL_PATH = os.environ.get('MODEL_PATH', 'THUDM/chatglm3-6b')改为
MODEL_PATH = os.environ.get('MODEL_PATH', '../chatglm3-6b')

这样所有的程序和模型都在一起,方便管理。

程序启动之后,浏览器显示如下:

安装过程中一些注意事项:

  • 遇到"RuntimeError: nvrtc: error: failed to open nvrtc-builtins64_121.dll.
    Make sure that nvrtc-builtins64_121.dll is installed correctly."

需要将虚拟环境下的"nvrtc-builtins64_121.dll"文件拷贝到C:\Windows\System32目录下,即可解决。

相关推荐
再不会python就不礼貌了4 小时前
从工具到个人助理——AI Agent的原理、演进与安全风险
人工智能·安全·ai·大模型·transformer·ai编程
言萧凡_CookieBoty5 小时前
省 Token 实战手册:从提示词到架构,开发中真正有效的降本策略
ai编程
databook8 小时前
别让AI代码,变成明天的技术债
人工智能·程序员·ai编程
与虾牵手9 小时前
Embedding API 怎么调用?2026 三种方案实测,附 RAG 完整代码
aigc·ai编程
与虾牵手10 小时前
React 性能优化实战:我把一个卡成 PPT 的页面优化到丝滑的全过程
ai编程
言之。11 小时前
Claude Code 保姆级教学:Vibe Coding 从入门到实战
ai编程
孟祥_成都11 小时前
别再吹牛了,100% Vibe Coding 存在无法自洽的逻辑漏洞!
前端·ai编程·vibecoding
腾讯云云开发11 小时前
用 OpenClaw + CloudBase 自动化开发网站:30分钟从安装到上线
后端·ai编程
ai超级个体12 小时前
别再吹牛了,100% Vibe Coding 存在无法自洽的逻辑漏洞!
前端·ai·ai编程·vibe coding
踩着两条虫12 小时前
告别低代码“黑盒”!VTJ.PRO 2.0:用AI与自由重塑Vue3开发
前端·低代码·ai编程