[论文笔记] LLM端侧小模型篇——1、剪枝量化的latency

心心喵2024-09-14 18:54

接 LLM大模型剪枝篇，开启LLM端侧小模型篇的极致0成本部署之路～！！！！

剪枝效果

量化效果

推理框架

MLC-LLM：编译器方式推理，跨平台可用推理框架

https://huggingface.co/mlc-ai

上一篇：详细分析linux中的MySql跳过密码验证以及Bug（图文）

下一篇：【BUG报错已解决】`ERROR: Failed building wheel for jupyter-nbextensions-configurator`

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05OpenClaw优化飞书API 额度已耗尽问题 06Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw大龙虾机器人完整安装教程