书生·浦语大模型实战营第五节课笔记及作业

LMDeploy 大模型量化部署实践

1 大模型部署背景

1.1 模型部署及大模型特点

1.2 大模型部署挑战及方案

2 LMDeploy简介


2.1 核心功能-量化



2.2 核心功能-推理引擎TurboMind





2.1 核心功能-推理服务api server

3 动手实践及作业

按照文档LMDeploy 的量化和部署中的步骤在InternStudio中的 A100(1/4) 机器上一步步操作即可!

3.1 基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型,生成 300 字的小故事(需截图)

3.1.1 本地对话形式
3.1.2 API服务形式
3.1.3 网页Gradio形式

TurboMind 服务作为后端:

TurboMind 推理作为后端

参考文献:

1、文档:LMDeploy 的量化和部署

2、视频:LMDeploy 大模型量化部署实践

相关推荐
潇冉沐晴5 小时前
div2 1052 个人补题笔记
笔记
蒙奇D索大6 小时前
【计算机网络】[特殊字符] 408高频考点 | 数据链路层组帧:从字符计数到违规编码,一文学透四大实现方法
网络·笔记·学习·计算机网络·考研
njsgcs6 小时前
tekla 使用笔记 切管 分割指定长度的管
笔记·tekla
蒙奇D索大8 小时前
【算法】 递归实战应用:从暴力迭代到快速幂的优化之路
笔记·考研·算法·改行学it
('-')8 小时前
《从根上理解MySQL》第一章学习笔记
笔记·学习·mysql
d111111111d8 小时前
STM32外设学习-串口发送数据-接收数据(笔记)
笔记·stm32·学习
昊喵喵博士10 小时前
直接用 JavaScript 给输入框赋值,Vue 页面input只是纯展示 并 没有触发 vue 的v-model 赋值
笔记
卡提西亚11 小时前
C++笔记-26-类模板
c++·笔记
yaocheng的ai分身12 小时前
停止过度思考 Obsidian:一份真正有效的初学者指南
笔记