【InternLM 实战营笔记】LMDeploy量化internlm2-chat-20b模型

准备环境

拉取环境

bash 复制代码
/root/share/install_conda_env_internlm_base.sh lmdeploy

激活环境

bash 复制代码
conda activate lmdeploy

安装依赖库

bash 复制代码
# 解决 ModuleNotFoundError: No module named 'packaging' 问题
pip install packaging
# 使用 flash_attn 的预编译包解决安装过慢问题
pip install /root/share/wheels/flash_attn-2.4.2+cu118torch2.0cxx11abiTRUE-cp310-cp310-linux_x86_64.whl

pip install 'lmdeploy[all]==v0.2.4'

复制模型

bash 复制代码
cp -r /root/share/model_repos/internlm2-chat-20b/ /root/model/

INT4 权重量化

bash 复制代码
lmdeploy lite auto_awq \
   "/root/model/internlm2-chat-20b/" \
  --calib-dataset 'ptb' \
  --calib-samples 128 \
  --calib-seqlen 2048 \
  --w-bits 4 \
  --w-group-size 128 \
  --work-dir ./quant_output 

使用控制台和模型对话

bash 复制代码
lmdeploy chat turbomind ./quant_output --model-format awq
相关推荐
Yeh2020581 天前
cookie与Session笔记
笔记
d111111111d1 天前
STM32-UART封装问题解析
笔记·stm32·单片机·嵌入式硬件·学习·算法
寒秋花开曾相惜1 天前
(学习笔记)4.2 逻辑设计和硬件控制语言HCL(4.2.1 逻辑门&4.2.2 组合电路和HCL布尔表达式)
linux·网络·数据结构·笔记·学习·fpga开发
Yeh2020581 天前
request与response笔记
java·前端·笔记
Fuyo_11191 天前
C++ 内存管理
c++·笔记
柳鲲鹏1 天前
李善兰和牛顿,谁剽窃谁的运动三定律
笔记
handler011 天前
Linux 进程探索:从 PCB 管理到 fork() 的写时拷贝
linux·c语言·c++·笔记·学习
xuhaoyu_cpp_java1 天前
MyBatis学习(五)
经验分享·笔记·学习·mybatis
AI_661465971 天前
副业平台收益效率评估:实验设计、指标体系与数据分析框架
经验分享·笔记
阿星_1 天前
Windows Subsystem for Linux (WSL) 运行 Firefox 浏览器时遇到中文乱码的解决方法
笔记