阿里云交互式建模(PAI-DSW)训练并微调推理ChatGLM模型

参考内容为《轻量微调和推理ChatGLM模型实践》

点击"交互式建模(DSW)",然后选择"创建实例"

写上实例名称,然后选择GPU规格,选择"ecs.gn6v-c8g1.2xlarge(8 vCPU,32GB)"

页面往下拉选择"pytorch:1.12-gpu-py39-cu113-ubuntu20.04"这个官方镜像,然后点击下一步。

在确认订单这里点击创建实例。

等着状态是运行中,然后点击打开。

选择notebook中Python 3(ipykernel)。

进入到下边的页面。

python 复制代码
import os
dsw_region = os.environ.get("dsw_region")
url_link = {
    "cn-shanghai": "https://atp-modelzoo-sh.oss-cn-shanghai-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-hangzhou": "https://atp-modelzoo.oss-cn-hangzhou-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-shenzhen": "https://atp-modelzoo-sz.oss-cn-shenzhen-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz",
    "cn-beijing": "https://atp-modelzoo-bj.oss-cn-beijing-internal.aliyuncs.com/release/tutorials/chatGLM/ChatGLM-6B-main.tar.gz", 
}

执行上边代码获取当前地域的下载链接。

添加代码框。

python 复制代码
path = url_link[dsw_region]
os.environ['LINK_CHAT'] = path
!wget $LINK_CHAT
!tar -xvf ChatGLM-6B-main.tar.gz

根据获取到的下载链接下载ChatGLM-6B数据。

python 复制代码
!cd ChatGLM-6B-main && pip install -r requirements.txt && \
pip install rouge_chinese nltk jieba datasets 

安装相关依赖。

执行完成之后:

!cd ChatGLM-6B-main/ptuning && wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/chatGLM/AdvertiseGen_Simple.zip && unzip AdvertiseGen_Simple.zip获取公共样例数据(AdvertiseGen_Simple)。

!cd ChatGLM-6B-main/ptuning && bash train.sh模型微调。生成的模型文件保存在./ChatGLM-6B-main/ptuning/chatglm-6b路径下。

!cd ChatGLM-6B-main/ptuning && bash evaluate.sh进行模型推理。

模型推理成功后,生成的推理结果保存在./ChatGLM-6B-main/ptuning/output/adgen-chatglm-6b-pt-8-1e-2/generated_predictions.txt

鼠标点击对应目录两下。

鼠标点击web_demo.py两下。

图中圈中的部分都改成./ptuning/output/adgen-chatglm-6b-pt-8-1e-2/checkpoint-6,然后按下Ctrl+s进行保存。

点击"Untitled.ipynb"。

!pwd看一下当前目录,!ls -l看一下当前目录里边的内容。

!cd ChatGLM-6B-main/ && python web_demo.py进入到目录里边,然后启动ChatGLM Web端,可以点击http://127.0.0.1:7860

显示页面如下图:

问它"什么是ChatGPT中的GPT?",然后点击Generate

在控制台点击删除。

选择删除实例。

删除完成之后如下图:

相关推荐
Inhand陈工9 天前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
Database_Cool_9 天前
什么是数据仓库物化视图?AnalyticDB MySQL 实时物化视图能力解析
人工智能·mysql·阿里云
Database_Cool_9 天前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless
tiancaijiben9 天前
阿里云Kubernetes集群托管完全指南:从创建到生产级运维
云计算
我是小bā吖9 天前
Claude Code 模型接入阿里云 AI 网关并统计不同使用者的模型用量
网络·人工智能·阿里云
翼龙云_cloud9 天前
阿里云国际代理商:如何使用RDS MySQL 构建网站数据库?
数据库·mysql·阿里云
互联网推荐官9 天前
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍
云原生·云计算·paas·软件开发·开发经验·上海
sbjdhjd9 天前
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
wcy100869 天前
为 CentOS 7.6 (7.6.1810) 配置阿里云 Vault 源
linux·阿里云·centos
Inhand陈工9 天前
污水泵站PLC数据上云实战:西门子PLC + 映翰通IG502 + DM平台全流程
人工智能·物联网·网络安全·阿里云·信息与通信·iot