书生·浦语大模型实战营第五节课笔记及作业

LMDeploy 大模型量化部署实践

1 大模型部署背景

1.1 模型部署及大模型特点

1.2 大模型部署挑战及方案

2 LMDeploy简介


2.1 核心功能-量化



2.2 核心功能-推理引擎TurboMind





2.1 核心功能-推理服务api server

3 动手实践及作业

按照文档LMDeploy 的量化和部署中的步骤在InternStudio中的 A100(1/4) 机器上一步步操作即可!

3.1 基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型,生成 300 字的小故事(需截图)

3.1.1 本地对话形式
3.1.2 API服务形式
3.1.3 网页Gradio形式

TurboMind 服务作为后端:

TurboMind 推理作为后端

参考文献:

1、文档:LMDeploy 的量化和部署

2、视频:LMDeploy 大模型量化部署实践

相关推荐
Cloud_Shy61816 小时前
解读《Effective Python 3rd Edition》:从练气到老魔(第三章 Item 21 - 24)
开发语言·人工智能·笔记·python·迭代器模式
nnsix16 小时前
Unity HybirdCLR 简单了解 笔记
笔记
handler0118 小时前
【算法】并查集(普通/扩展/带权)模板与例题
数据结构·c++·笔记·算法·c·图论·查并集
中屹指纹浏览器18 小时前
指纹浏览器环境克隆、批量派生的风控隐患剖析与标准化新建环境实操指南
经验分享·笔记
.千余18 小时前
【C++】C++手写Vector容器:从底层源码模拟实现
开发语言·c++·经验分享·笔记·学习
元直数字电路验证19 小时前
云计算实验笔记(四):容器编排(Container Orchestration)
运维·笔记·docker·云计算
自小吃多19 小时前
某志步进电机驱动器故障排查标准流程
笔记
zhangrelay20 小时前
后智能时代智能体推演预测娱乐文-节选-
笔记·学习·娱乐
小碗羊肉20 小时前
【Agent笔记 | 第六篇】Agent关键组件
笔记·agent
likerhood20 小时前
服务器使用 vLLM 部署 Qwen2.5-Coder-7B-CL 笔记
服务器·笔记·vllm