【#第三期实战营闯关作业##LMDeploy 量化部署进阶实践 】

今天学习了《LMDeploy 量化部署进阶实践》一课,,收获很大。以下是记录复现过程及截图:

创建一个名为lmdeploy的conda环境

创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。

相关包install成功

创建好的conda环境并启动InternLM2_5-7b-chat。这是对话截图

运行InternLM2.5 -20B模型,会发现此时显存占用大约71G:单卡80G-220=40G,40 0.8=32G,so,(权重)2*20G+32G(cache占用)=72G.

启动API服务器。后端logo

api的ui

以Gradio网页形式连接API服务器,输入http://127.0.0.1:6006,然后就可以与模型尽情对话了,就是上面截图。

相关推荐
AKAMAI3 分钟前
Forrester调研400位高级决策者,揭示AI应用未来
人工智能·云计算
KKKlucifer3 分钟前
数据智能时代的安全困局与 AI 破局逻辑
人工智能·安全
Dm_dotnet13 分钟前
Microsoft Agent Framework/C#:了解Workflows的几种不同模式
人工智能
Macbethad18 分钟前
基于世界模型的自动驾驶控制算法
人工智能·机器学习·自动驾驶
带电的小王19 分钟前
【AI大模型技术】4.预训练语言模型(PLMs,Pre-trained Langue Models);5.Transformers Tutorial
人工智能·语言模型·自然语言处理
搬砖者(视觉算法工程师)27 分钟前
自动驾驶技术前沿:传感器技术
人工智能·自动驾驶
算法与编程之美1 小时前
探究pytorch中多个卷积层和全连接层的输出方法
人工智能·pytorch·深度学习·神经网络·cnn
d111111111d1 小时前
STM32中为什么会有APB1和APB2两个外设有什么区别
笔记·stm32·单片机·嵌入式硬件·学习
Master_oid1 小时前
机器学习21:可解释机器学习(Explainable Machine Learning)(上)
人工智能·机器学习
MobotStone1 小时前
边际成本趋近于零:如何让AI智能体"说得清、讲得明"
人工智能·架构