技术栈
[论文笔记] LLM端侧小模型篇——1、剪枝量化的latency
心心喵
2024-09-14 18:54
接 LLM大模型剪枝篇,开启LLM端侧小模型篇的极致0成本部署之路~!!!!
剪枝效果
量化效果
推理框架
MLC-LLM:编译器方式推理,跨平台可用推理框架
https://huggingface.co/mlc-ai
人工智能
上一篇:
详细分析linux中的MySql跳过密码验证以及Bug(图文)
下一篇:
【BUG报错已解决】`ERROR: Failed building wheel for jupyter-nbextensions-configurator`
相关推荐
袋鼠云数栈UED团队
15 分钟前
一套 Spec-First 的 AI 编程工作流
前端
·
人工智能
Awu1227
25 分钟前
⚡从零开发 Agent CLI(二):CLI 框架搭建与子命令路由
人工智能
·
aigc
码上天下
29 分钟前
React Query 缓存 AI 对话历史的几个权衡
人工智能
米小虾
39 分钟前
2026半年盘点:AI界发生的6件大事,正在彻底改变产业格局
人工智能
道友可好
3 小时前
让 AI 自己验收,等于让学生自己批卷
前端
·
人工智能
·
后端
美团技术团队
3 小时前
美团海报生成 AIGC 技术创新与实践
人工智能
冬哥聊AI
4 小时前
放弃 Spring AI?这 3 个开源框架,才是让 SpringBoot 玩转 AI Agent 的正解
人工智能
小爷毛毛_卓寿杰
4 小时前
当 max_tokens=1 遇上 reasoning 模型:从 Xagent 一次“测试连接“按钮的失败说起
人工智能
用户519149584845
4 小时前
Flex QR Code Generator 漏洞利用工具 CVE-2025-10041
人工智能
·
aigc
热门推荐
01
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
02
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
03
【AI】2026 年具身智能模型和世界模型总结
04
2026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?
05
GitHub 镜像站点
06
2026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?
07
AI科技热点日报 | 2026年6月1日
08
Codex 下载安装指南:Windows 和 macOS 官方版下载
09
上线仅72小时被强制下架:Claude Fable 5 的短命
10
HTTP 与 HTTPS 的区别:从原理到实战详解