技术栈
[论文笔记] LLM端侧小模型篇——1、剪枝量化的latency
心心喵
2024-09-14 18:54
接 LLM大模型剪枝篇,开启LLM端侧小模型篇的极致0成本部署之路~!!!!
剪枝效果
量化效果
推理框架
MLC-LLM:编译器方式推理,跨平台可用推理框架
https://huggingface.co/mlc-ai
人工智能
上一篇:
详细分析linux中的MySql跳过密码验证以及Bug(图文)
下一篇:
【BUG报错已解决】`ERROR: Failed building wheel for jupyter-nbextensions-configurator`
相关推荐
网络工程小王
4 分钟前
【Python数据分析基础】
大数据
·
数据库
·
人工智能
·
学习
skilllite作者
6 分钟前
开源项目推荐SkillLite,项目取得阶段性成果总结
人工智能
二十雨辰
14 分钟前
[RAG]-智能体开发
人工智能
·
ai
第七页独白
20 分钟前
全星研发项目管理 APQP 软件系统:驱动高端制造研发数智化升级
人工智能
FluxMelodySun
21 分钟前
机器学习(二十七) 降维:度量学习与随机梯度下降法求解
人工智能
·
学习
·
机器学习
蒸汽求职
24 分钟前
【蒸汽教育求职干货】OPT只剩3个月还没找到工作,怎么办?——留学生IT求职的“紧急预案”
人工智能
·
经验分享
·
面试
·
职场和发展
·
美国求职
陆业聪
24 分钟前
从推理到行动:Agent 范式的真正跃迁正在发生
人工智能
·
aigc
蒸汽求职
27 分钟前
【蒸汽教育求职分享】美国IT面试的Behavioral Question:STAR法则人人都知道,但90%的人用错了
人工智能
·
面试
·
职场和发展
·
github
·
求职招聘
·
留学生求职
人工智能研究所
32 分钟前
字节开源 DeerFlow 2.0——登顶 GitHub Trending 1,让 AI 可做任何事情
人工智能
·
深度学习
·
开源
·
github
·
ai agent
·
字节跳动
·
deerflow2.0
江瀚视野
32 分钟前
美丽田园经调净利大增41%,全方位增长未来何在?
大数据
·
人工智能
热门推荐
01
2026年3月AI领域大事件:DeepSeek引领开源风暴
02
GitHub 镜像站点
03
围棋-html版本
04
小黑课堂计算机二级WPSoffice题库软件下载安装教程(2026年3月最新版)
05
班级宠物园部署指南
06
【计算机一级WPSoffice】小黑课堂题库软件下载安装教程(2026年3月最新版)
07
UV安装并设置国内源
08
“wsl --install -d Ubuntu-22.04”下载慢,中国地区离线安装 Ubuntu 22.04 WSL方法(亲测2025年5月6日)
09
Qwen3.5 开源全解析:从 0.8B 到 397B,代际升级 + 全场景选型指南
10
中国象棋-html版本