[书生·浦语大模型实战营]——LMDeploy 量化部署 LLM 实践

1.基础作业

1.1配置 LMDeploy 运行环境

创建开发机

创建新的开发机,选择镜像Cuda12.2-conda;选择10% A100*1GPU;点击"立即创建"。注意请不要选择Cuda11.7-conda的镜像,新版本的lmdeploy会出现兼容性问题。其他和之前一样,不赘述。

创建conda环境

c 复制代码
studio-conda -t lmdeploy -o pytorch-2.1.2

安装LMDeploy

c 复制代码
#激活虚拟环境
conda activate lmdeploy
#安装0.3.0的imdeploy
pip install lmdeploy[all]==0.3.0

1.2以命令行方式与 InternLM2-Chat-1.8B 模型对话


2.进阶作业

2.1 设置KV Cache最大占用比例为0.4,开启W4A16量化,以命令行方式与模型对话。


2.2 以API Server方式启动 lmdeploy,开启 W4A16量化,调整KV Cache的占用比例为0.4,分别使用命令行客户端与Gradio网页客户端与模型对话。

命令行:

网页客户端:

2.3 使用W4A16量化,调整KV Cache的占用比例为0.4,使用Python代码集成的方式运行internlm2-chat-1.8b模型。

2.4 使用 LMDeploy 运行视觉多模态大模型 llava gradio demo。


相关推荐
咚咚王者13 小时前
人工智能之数学基础 线性代数:第一章 向量与矩阵
人工智能·线性代数·矩阵
非著名架构师13 小时前
嵌入业务的“气象智能芯片”:能源与金融企业如何将AI气象组件化为运营核心?
人工智能·深度学习·风光功率预测·高精度光伏功率预测模型·高精度气象数据
计算机学姐13 小时前
基于Python的智能点餐系统【2026最新】
开发语言·vue.js·后端·python·mysql·django·flask
ULTRA??13 小时前
C++两个数组连接类似python的list相加
c++·python
asixpm13 小时前
新品速递 | 亚信电子推出 AX88279A —— 强化智能联网与边缘计算的 USB 3.2 转 2.5G 以太网控制芯片
人工智能·物联网·5g·边缘计算·以太网
MicroTech202513 小时前
微算法科技(NASDAQ MLGO)采用混合深度学习赋能区块链:打造智慧城市安全新范式
科技·深度学习·算法
栈低来信13 小时前
Linux侵入式链表详解
linux·链表
一瞬祈望13 小时前
⭐ 深度学习入门体系(第 2 篇): 为什么神经网络一定需要激活函数?
人工智能·深度学习·神经网络
7ioik13 小时前
什么是双亲委派?
开发语言·python
Drise_13 小时前
解码器详解(训练过程)
深度学习