阿里云交互式建模(PAI-DSW)训练并微调推理ChatGLM模型

参考内容为《轻量微调和推理ChatGLM模型实践》

点击"交互式建模(DSW)",然后选择"创建实例"

写上实例名称,然后选择GPU规格,选择"ecs.gn6v-c8g1.2xlarge(8 vCPU,32GB)"

页面往下拉选择"pytorch:1.12-gpu-py39-cu113-ubuntu20.04"这个官方镜像,然后点击下一步。

在确认订单这里点击创建实例。

等着状态是运行中,然后点击打开。

选择notebook中Python 3(ipykernel)。

进入到下边的页面。

python 复制代码
import os
dsw_region = os.environ.get("dsw_region")
url_link = {
    "cn-shanghai": "https://atp-modelzoo-sh.oss-cn-shanghai-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-hangzhou": "https://atp-modelzoo.oss-cn-hangzhou-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-shenzhen": "https://atp-modelzoo-sz.oss-cn-shenzhen-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-beijing": "https://atp-modelzoo-bj.oss-cn-beijing-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz", 
}

执行上边代码获取当前地域的下载链接。

添加代码框。

python 复制代码
path = url_link[dsw_region]
os.environ['LINK_CHAT'] = path
!wget $LINK_CHAT
!tar -xvf ChatGLM-6B-main.tar.gz

根据获取到的下载链接下载ChatGLM-6B数据。

python 复制代码
!cd ChatGLM-6B-main && pip install -r requirements.txt && \
pip install rouge_chinese nltk jieba datasets 

安装相关依赖。

执行完成之后:

!cd ChatGLM-6B-main/ptuning && wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/chatGLM/AdvertiseGen_Simple.zip && unzip AdvertiseGen_Simple.zip获取公共样例数据(AdvertiseGen_Simple)。

!cd ChatGLM-6B-main/ptuning && bash train.sh模型微调。生成的模型文件保存在./ChatGLM-6B-main/ptuning/chatglm-6b路径下。

!cd ChatGLM-6B-main/ptuning && bash evaluate.sh进行模型推理。

模型推理成功后,生成的推理结果保存在./ChatGLM-6B-main/ptuning/output/adgen-chatglm-6b-pt-8-1e-2/generated_predictions.txt

鼠标点击对应目录两下。

鼠标点击web_demo.py两下。

图中圈中的部分都改成./ptuning/output/adgen-chatglm-6b-pt-8-1e-2/checkpoint-6,然后按下Ctrl+s进行保存。

点击"Untitled.ipynb"。

!pwd看一下当前目录,!ls -l看一下当前目录里边的内容。

!cd ChatGLM-6B-main/ && python web_demo.py进入到目录里边,然后启动ChatGLM Web端,可以点击http://127.0.0.1:7860

显示页面如下图:

问它"什么是ChatGPT中的GPT?",然后点击Generate

在控制台点击删除。

选择删除实例。

删除完成之后如下图:

相关推荐
曼城周杰伦3 小时前
自然语言处理:第六十三章 阿里Qwen2 & 2.5系列
人工智能·阿里云·语言模型·自然语言处理·chatgpt·nlp·gpt-3
学Linux的语莫4 小时前
Ansible使用简介和基础使用
linux·运维·服务器·nginx·云计算·ansible
奥能电源7 小时前
移动充储机器人“小奥”的多场景应用(上)
阿里云·能源
运维&陈同学8 小时前
【zookeeper03】消息队列与微服务之zookeeper集群部署
linux·微服务·zookeeper·云原生·消息队列·云计算·java-zookeeper
云计算DevOps-韩老师9 小时前
【网络云计算】2024第47周-每日【2024/11/21】周考-实操题-RAID6实操解析2
网络·云计算
tian2kong11 小时前
Centos 7 修改YUM镜像源地址为阿里云镜像地址
linux·阿里云·centos
dessler12 小时前
云计算&虚拟化-kvm-扩缩容cpu
linux·运维·云计算
学Linux的语莫12 小时前
Ansible Playbook剧本用法
linux·服务器·云计算·ansible
cloud studio AI应用16 小时前
腾讯云 AI 代码助手:产品研发过程的思考和方法论
人工智能·云计算·腾讯云
小曲曲21 小时前
接口上传视频和oss直传视频到阿里云组件
javascript·阿里云·音视频