python-华为云modelarts的免费codelab运行chatglm2-6b-int4

前提:当前提供 了8核64G的免费体验规格,每天三个小时限额

地址:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dashboard

下载模型:请参考另一个文章

复制代码
创建环境(自带环境是pytorch1.8的,所以自己创建)

conda info --env

conda create --name pytorch2.0

conda activate pytorch2.0


安装必要的包

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

conda install pytorch torchvision torchaudio cpuonly -c pytorch

conda update -n base -c defaults conda

conda install transformers sentencepiece

pip install rouge_chinese cpm_kernels

运行代码

from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4", 
trust_remote_code=True)

model = AutoModel.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4",trust_remote_code=True).cuda()

model = AutoModel.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4",trust_remote_code=True).float()

model = model.eval()

response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=[])

print(response)
相关推荐
爱学习的阿磊3 分钟前
使用PyTorch构建你的第一个神经网络
jvm·数据库·python
阿狸OKay5 分钟前
einops 库和 PyTorch 的 einsum 的语法
人工智能·pytorch·python
松☆30 分钟前
Dart 核心语法精讲:从空安全到流程控制(3)
android·java·开发语言
编码者卢布43 分钟前
【Azure Storage Account】Azure Table Storage 跨区批量迁移方案
后端·python·flask
可触的未来,发芽的智生1 小时前
狂想:为AGI代称造字ta,《第三类智慧存在,神的赐名》
javascript·人工智能·python·神经网络·程序人生
编码者卢布1 小时前
【App Service】Java应用上传文件功能部署在App Service Windows上报错 413 Payload Too Large
java·开发语言·windows
kaikaile19951 小时前
结构风荷载理论与Matlab计算
开发语言·matlab
切糕师学AI1 小时前
ARM 汇编器中的伪指令(Assembler Directives)
开发语言·arm开发·c#
吴维炜1 小时前
「Python算法」计费引擎系统SKILL.md
python·算法·agent·skill.md·vb coding
吕司1 小时前
Qt的信号与槽
开发语言·qt