书生·浦语大模型实战营第五节课笔记及作业

LMDeploy 大模型量化部署实践

1 大模型部署背景

1.1 模型部署及大模型特点

1.2 大模型部署挑战及方案

2 LMDeploy简介


2.1 核心功能-量化



2.2 核心功能-推理引擎TurboMind





2.1 核心功能-推理服务api server

3 动手实践及作业

按照文档LMDeploy 的量化和部署中的步骤在InternStudio中的 A100(1/4) 机器上一步步操作即可!

3.1 基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型,生成 300 字的小故事(需截图)

3.1.1 本地对话形式
3.1.2 API服务形式
3.1.3 网页Gradio形式

TurboMind 服务作为后端:

TurboMind 推理作为后端

参考文献:

1、文档:LMDeploy 的量化和部署

2、视频:LMDeploy 大模型量化部署实践

相关推荐
不会代码的小猴8 分钟前
C++的第九天笔记
开发语言·c++·笔记
我命由我123451 小时前
开发中的英语积累 P19:Inspect、Hint、Feedback、Direction、Compact、Vulnerability
经验分享·笔记·学习·职场和发展·求职招聘·职场发展·学习方法
老王熬夜敲代码2 小时前
C++中的thread
c++·笔记·面试
崇山峻岭之间3 小时前
C++ Prime Plus 学习笔记033
c++·笔记·学习
暗然而日章3 小时前
C++基础:Stanford CS106L学习笔记 7 类
c++·笔记·学习
思成不止于此3 小时前
【MySQL 零基础入门】DDL 核心语法全解析:数据库与表结构操作篇
数据库·笔记·学习·mysql
lkbhua莱克瓦244 小时前
Java进阶——IO流
java·开发语言·笔记·学习方法·io流
浦东新村轱天乐4 小时前
2025.12.01-2025.12.07:休假回来,开始迭代vlm
笔记
im_AMBER4 小时前
Leetcode 72 数组列表中的最大距离
c++·笔记·学习·算法·leetcode
FFF团团员9094 小时前
树莓派学习笔记7:局域网的建立和程序自启动
笔记·学习