【#第三期实战营闯关作业##LMDeploy 量化部署进阶实践 】

今天学习了《LMDeploy 量化部署进阶实践》一课,,收获很大。以下是记录复现过程及截图:

创建一个名为lmdeploy的conda环境

创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。

相关包install成功

创建好的conda环境并启动InternLM2_5-7b-chat。这是对话截图

运行InternLM2.5 -20B模型,会发现此时显存占用大约71G:单卡80G-220=40G,40 0.8=32G,so,(权重)2*20G+32G(cache占用)=72G.

启动API服务器。后端logo

api的ui

以Gradio网页形式连接API服务器,输入http://127.0.0.1:6006,然后就可以与模型尽情对话了,就是上面截图。

相关推荐
Godspeed Zhao27 分钟前
自动驾驶中的传感器技术36——Lidar(11)
人工智能·机器学习·自动驾驶·全固态激光雷达
不老刘1 小时前
《生成式AI消费级应用Top 100——第五版》| a16z
人工智能·ai·chatgpt·a16z
ZZHow10242 小时前
React前端开发_Day4
前端·笔记·react.js·前端框架·web
此处不留情3 小时前
基于pytorch的垃圾分类识别项目实战
人工智能·pytorch
mit6.8243 小时前
[AI人脸替换] docs | 环境部署指南 | 用户界面解析
人工智能·python
fantasy_arch3 小时前
Pytorch超分辨率模型实现与详细解释
人工智能·pytorch·python
爱读源码的大都督4 小时前
小白LLM教程:不训练模型,如何进行微调?
java·人工智能·后端
十安_数学好题速析4 小时前
数列寻方:等差数列和为完全平方数
笔记·学习·高考
大千AI助手4 小时前
接吻数问题:从球体堆叠到高维空间的数学奥秘
人工智能·agi·deepmind·接吻数·kissingnumber·牛顿·alphaevolve
程序猿小D4 小时前
【完整源码+数据集+部署教程】硬币分类与识别系统源码和数据集:改进yolo11-SWC
人工智能·yolo·计算机视觉·数据挖掘·数据集·yolo11·硬币分类与识别系统