技术栈
[论文笔记] LLM端侧小模型篇——1、剪枝量化的latency
心心喵
2024-09-14 18:54
接 LLM大模型剪枝篇,开启LLM端侧小模型篇的极致0成本部署之路~!!!!
剪枝效果
量化效果
推理框架
MLC-LLM:编译器方式推理,跨平台可用推理框架
https://huggingface.co/mlc-ai
人工智能
上一篇:
详细分析linux中的MySql跳过密码验证以及Bug(图文)
下一篇:
【BUG报错已解决】`ERROR: Failed building wheel for jupyter-nbextensions-configurator`
相关推荐
笑衬人心。
21 分钟前
初学Spring AI 笔记
人工智能
·
笔记
·
spring
luofeiju
31 分钟前
RGB下的色彩变换:用线性代数解构色彩世界
图像处理
·
人工智能
·
opencv
·
线性代数
测试者家园
33 分钟前
基于DeepSeek和crewAI构建测试用例脚本生成器
人工智能
·
python
·
测试用例
·
智能体
·
智能化测试
·
crewai
张较瘦_
37 分钟前
[论文阅读] 人工智能 + 软件工程 | Call Me Maybe:用图神经网络增强JavaScript调用图构建
论文阅读
·
人工智能
·
软件工程
大模型真好玩
38 分钟前
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战
人工智能
·
python
·
mcp
Baihai_IDP
1 小时前
vec2text 技术已开源!一定条件下,文本嵌入向量可“近乎完美地”还原
人工智能
·
面试
·
llm
江太翁
1 小时前
Pytorch torch
人工智能
·
pytorch
·
python
拓端研究室
1 小时前
专题:2025即时零售与各类人群消费行为洞察报告|附400+份报告PDF、原数据表汇总下载
大数据
·
人工智能
网安INF
1 小时前
深度学习中的逻辑回归:从原理到Python实现
人工智能
·
python
·
深度学习
·
算法
·
逻辑回归
Despacito0o
1 小时前
ESP32-s3摄像头驱动开发实战:从零搭建实时图像显示系统
人工智能
·
驱动开发
·
嵌入式硬件
·
音视频
·
嵌入式实时数据库
热门推荐
01
Coze实战第13讲:飞书多维表格读取+豆包生图模型,轻松批量生成短剧封面
02
如何将markdown生成pdf
03
Coze扣子平台完整体验和实践(附国内和国际版对比)
04
Word粘贴时出现“运行时错误53,文件未找到:MathPage.WLL“的解决方案
05
手机电脑之间快速传输图片视频文件,不压缩画质、不限制大小的方法!
06
扣子(coze)实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解
07
扣子空间的使用教程与大模型技术思考
08
鸽了六年的某大厂面试题:你会手写一个模板引擎吗?
09
DeepSeek各版本说明与优缺点分析
10
GPU 进阶笔记(二):华为昇腾 910B GPU