任务描述
本节任务是安装和配置chatgpt项目所需的软件以及chatgpt项目所需要的python库包,同时编写python代码来完成chatgpt项目的人机对话功能。
实验工具
显卡GTX1070(专用内存需要大于等于6G)以上电脑、Pycharm软件、Python3.10软件、cuda11.0软件。
任务实施
任务一 环境配置
cuda11.0软件百度网盘获取:
链接:https://pan.baidu.com/s/1KOJfAVR6nKmVafNnmbsYDw
提取码:lblh
cudnn11.0百度网盘获取:
链接:https://pan.baidu.com/s/1CBuq7jflihEDuclSq-RTJA
提取码:efgu
一.Cuda11.0软件安装配置
1.找到cudnn-11.0-windows-x64-v8.0.4.30.zip压缩包,并且解压它。
2.解压后双击点开,准备安装cuda11.0软件。
3.选择默认路径,点击ok。
4.等待检查系统的兼容性。
5.检查完后,点击同意并继续。
6.在这里,我们选择"自定义(c)(高级)",然后点击下一步。
7.点击CUDA左边的"+"号。
8.查看Visual Studio Integration选项,点击取消Visual Studio Integration打得勾,然后点击下一步。
9.继续点击下一步。
10.等待安装完成。
11.安装成功,点击下一步即可。
12.安装完成后,找到cudnn-11.0-windows-x64-v8.0.4.30.zip压缩包,并且解压。
13.将cuda文件夹内的所有文件复制到默认路径C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0
14.检测,按windows+R键,输入cmd回车,输入:nvcc -V,显示有V11.0的版本即为检测成功。
二.Python软件安装与配置
python3.10软件百度网盘获取:
链接:https://pan.baidu.com/s/1t5jfcvalXEJ-wF_hapjw7Q
提取码:brbh
1.找到python软件python-3.10.11-amd64.exe,双击点开准备进行安装。
2.先选择Add Python.exe to PATH自动配置系统环境,再点击Install Now。
3.等待python软件的安装进程。
4.出现Close说明安装完成,点击Close完成安装。
三.Pycharm软件安装与配置
1.找到pycharm软件pycharm-community-2020.2.1.exe。
2.双击点开pycharm-community-2020.2.1.exe。
3.点击Next。
4.选择你安装的路径,在这里我安装在默认的路径中,继续点击Next。
5.勾选64-bit launcher和Add launchers dir to the PATH,如图1-1-30所示,继续点击Next。
6.点击Install。
7.等待安装。
8.出现Finish,说明完成安装,点击Finish结束安装。
任务二 运行chatgpt项目
chatgml2-6B项目(不包括模型):
链接:https://pan.baidu.com/s/1KojC0Mgt09JVq7sZcrSpwg
提取码:xqtj
chatgml2-6B项目模型地址:https://huggingface.co/THUDM/chatglm2-6b/tree/main
一.Python库包的安装
1.找到Pycharm桌面快捷方式,双击打开。
2.选择界面编辑底色,黑色或者白色,这里我选黑色,然后点击Next:Featured plugins。
3.点击Start using PyCharm,开始使用Pycharm。
4.选择Open。
5.找到ChatGLM2-6B-main项目路径,点击ok,打开ChatGLM2-6B-main项目。
6.找到File位置,点击File。
7.点击Settings...。
8.找到Python Interpreter,点击Python Interpreter。
9.点击设置按钮,点击Add。
10.点击System Interpreter,然后点击OK。
11,然后会出现python3.10环境,注意这里会显示3.9,是因为Pycharm软件目前不支持显示Python3.10,但不影响。
12.点击ok。即环境设置完成。
13.找到Terminal,打开Terminal窗口。
14.使用以下命令进入gpu库包路径:
cd gpu库包
15.使用以下命令安装torch库包:
pip install "torch-2.0.1+cu117-cp310-cp310-win_amd64.whl"
16.使用以下命令安装torchaudio库包:
pip install "torchaudio-2.0.2+cu117-cp310-cp310-win_amd64.whl"
17.使用以下命令安装torchvision库包:
pip install "torchvision-0.15.2+cu117-cp310-cp310-win_amd64.whl"
18.依次使用以下命令安装其他库包:
cd ...
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
19.使用以下命令安装cudnn相关依赖库包:
pip install nvidia-cudnn-cu11 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install nvidia-cuda-runtime-cu11 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install nvidia-cublas-cu11 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install nvidia-cuda-nvrtc-cu11 -i https://pypi.tuna.tsinghua.edu.cn/simple
二.Python代码编写运行测试
1.新建一个main.py文件,依次点击New->Python File。
2.输入main.py并且回车,创建main.py文件。
3.然后准备开始编写代码,首先调用加载模型的库包
代码如下:
from transformers import AutoTokenizer, AutoModel
4.写一段加载大模型的代码,以供后续使用
代码如下:
tokenizer = AutoTokenizer.from_pretrained("chatglm2", trust_remote_code=True)
model = AutoModel.from_pretrained("chatglm2", trust_remote_code=True).half().quantize(4).cuda()
model = model.eval()
5.定义一个main函数,该main函数的功能是人机对话。
代码如下:
def main():
6.定义一个列表,并且输出功能描述。
代码如下:
history =[]
print("欢迎使用 ChatGLM2-6B 模型,输入内容即可进行对话")
7.定义一个循环,该循环作用是可以循环人机对话。
代码如下:
while True:
8.写一个用户输入的接口,用户可以在此输入问题。
代码如下:
query = input("\n用户:")
9.写一个判断语句,如果输入"stop"则停止人机对话,否则将继续往下执行。
代码如下:
if query.strip() == "stop":
break
10.显示机器名称以及定义一个参数
代码如下:
print("\nChatGLM:", end="")
current_length = 0
11.持续输出机器人对用户的提问作出的回答语句。
代码如下:
for response, history, past_key_values in model.stream_chat(tokenizer,
query, history=history,
past_key_values=None,
return_past_key_values=True):
print(response[current_length:], end="", flush=True)
current_length = len(response)
print("")
12.写一个程序执行入口,执行main函数。
代码如下:
if name == "main ":
main()
13.写完之后运行main.py文件。
14.运行后加载大模型过程中需要等待一段时间,加载模型过程如下。
15.运行成功后,输入"你好",查看回答。
16.询问"晚上睡不着怎么办?",查看回答。