【#第三期实战营闯关作业##LMDeploy 量化部署进阶实践 】

今天学习了《LMDeploy 量化部署进阶实践》一课,,收获很大。以下是记录复现过程及截图:

创建一个名为lmdeploy的conda环境

创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。

相关包install成功

创建好的conda环境并启动InternLM2_5-7b-chat。这是对话截图

运行InternLM2.5 -20B模型,会发现此时显存占用大约71G:单卡80G-220=40G,40 0.8=32G,so,(权重)2*20G+32G(cache占用)=72G.

启动API服务器。后端logo

api的ui

以Gradio网页形式连接API服务器,输入http://127.0.0.1:6006,然后就可以与模型尽情对话了,就是上面截图。

相关推荐
xhyyvr22 分钟前
VR消防安全知识竞赛:“燃”动智慧,“竞”学消防
人工智能·vr·vr消防安全·vr消防安全体验馆
张较瘦_24 分钟前
[论文阅读] AI + 硬件开发 | 硬件设计新范式:LLM赋能行为驱动开发,解决验证痛点的实战方案
论文阅读·人工智能·驱动开发
cici1587426 分钟前
基于高斯混合模型(GMM)的说话人识别系统MATLAB实现
开发语言·人工智能·matlab
崇山峻岭之间26 分钟前
Matlab学习记录11
开发语言·学习·matlab
Mabnus27 分钟前
降钙素基因相关肽CGRP
学习
10岁的博客29 分钟前
AI创新大赛:技术深度与创意碰撞
人工智能
q_302381955631 分钟前
14.7MB轻量模型!NVIDIA Jetson边缘设备解锁工厂设备故障预警新方案
人工智能·python·算法·ascend·算子开发
大鹏的NLP博客33 分钟前
大模型中为什么 CoT 对分类有效?
人工智能·分类·数据挖掘
Vic1010133 分钟前
Redis防重复点击与分布式锁实现方案对比笔记
java·redis·笔记·分布式
realze36 分钟前
关于我80%的代码都用AI生成这件事
人工智能·代码规范·全栈