【#第三期实战营闯关作业##LMDeploy 量化部署进阶实践 】

今天学习了《LMDeploy 量化部署进阶实践》一课,,收获很大。以下是记录复现过程及截图:

创建一个名为lmdeploy的conda环境

创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。

相关包install成功

创建好的conda环境并启动InternLM2_5-7b-chat。这是对话截图

运行InternLM2.5 -20B模型,会发现此时显存占用大约71G:单卡80G-220=40G,40 0.8=32G,so,(权重)2*20G+32G(cache占用)=72G.

启动API服务器。后端logo

api的ui

以Gradio网页形式连接API服务器,输入http://127.0.0.1:6006,然后就可以与模型尽情对话了,就是上面截图。

相关推荐
sali-tec1 分钟前
C# 基于OpenCv的视觉工作流-章51-点查找
图像处理·人工智能·opencv·算法·计算机视觉
守护安静星空3 分钟前
esp32开发笔记-wifi网络
网络·笔记·vscode·单片机·tcp/ip
scholar沛4 分钟前
Obsidian & Zotero 联动 - 如何快速从Zotero生成一篇文献笔记
笔记
CompaqCV5 分钟前
OpencvSharp 算子学习教案之 - Cv2.Add
学习·c#·opencvsharp算子
FluxMelodySun6 分钟前
机器学习(三十二) 半监督学习-基于分歧的方法与半监督聚类
人工智能·算法·机器学习
预见AI9 分钟前
康耐视VisionPro连接海康相机教程(Gige)及常见错误问题
人工智能·计算机视觉·visionpro·海康相机
CompaqCV10 分钟前
OpencvSharp 算子学习教案之 - Cv2.Subtract 重载3
学习·c#·opencvsharp算子·opencv教程
xushichang123_13 分钟前
AI销售助手工具推荐:径硕科技(JINGdigital)与JINGEO,赋能B2B销售团队高效增长
大数据·人工智能·科技
金融Tech趋势派14 分钟前
企业微信收费吗?2026年最新收费标准
人工智能·企业微信
竹之却14 分钟前
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战
人工智能·大模型·检索增强·faiss·rag