技术栈
蒸馏模型
万事可爱^
8 天前
人工智能
·
深度学习
·
大模型
·
蒸馏模型
·
持续部署
·
deepseek
本地部署DeepSeek后的调用与删除全攻略
在本地成功部署DeepSeek模型后,如何高效调用它发挥其强大功能,以及在不需要时妥善删除,是很多用户关注的重点。我也在后台接到了很多粉丝的留言,询问 DeepSeek 本地部署之后的一些调用和删除的问题,于是我在网上找了现在主流热门的三种本地部署方案,对照他们的部署方式对出了调用和删除的指令,接下来,我们将从不同的部署方式入手,详细介绍对应的调用和删除方法。
Isawany
2 年前
论文阅读
·
蒸馏模型
·
distillation
·
soft target
·
模型压缩
论文笔记--Distilling the Knowledge in a Neural Network
文章提出了一种将大模型压缩的新的思路:蒸馏distillation。通过蒸馏,可以将很大的模型压缩为轻量级的模型,从而提升推理阶段的速率。