技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
翔云123456
14 分钟前
OpenClaw记忆系统
大模型
·
openclaw
不会吉他的肌肉男不是好的挨踢男
40 分钟前
Windows 下安装 sqlBot
sql
·
ai
·
大模型
·
bi
天涯明月1993
1 小时前
QClaw完全指南_AI代理网关架构与多代理管理实战
人工智能
·
架构
·
大模型
·
agent
Captain_Data
2 小时前
Meta裁员8000人:AI驱动组织重构的技术解析
人工智能
·
python
·
ai
·
重构
·
meta
·
大模型
·
裁员
Liiiks
16 小时前
GPT-Image-2来了!实测:文字渲染99%,UI截图像素级还原,前端工作流要变天了
人工智能
·
gpt
·
chatgpt
·
大模型
·
ai生图
·
gpt-image-2
·
图片设计
qq_白羊座
19 小时前
大模型根据数据媒体类型分类及基于模型的产品特点
大模型
龙侠九重天
1 天前
Token是什么?深入理解计费与上下文窗口
人工智能
·
ai
·
大模型
·
llm
·
token
CoderJia程序员甲
1 天前
GitHub 热榜项目 - 日榜(2026-04-23)
人工智能
·
ai
·
大模型
·
github
·
ai教程
jiucaixiuyang
1 天前
散户如何使用手机T0算法?
算法
·
量化
·
t0
AI算法沐枫
1 天前
OpenAI Operator vs Claude Act:两大厂商Agent对比
人工智能
·
深度学习
·
神经网络
·
计算机视觉
·
大模型
·
rag
热门推荐
01
2026年4月技术前沿:AI大模型爆发、智能体革命与量子安全新纪元
02
GitHub 镜像站点
03
近期有什么ai的新消息,新动态? 2026.4月
04
2026年4月AI大事件深度解读:大模型竞争进入“深水区“
05
codex app每次打开重连5次Reconnecting问题解决
06
AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析
07
2026年AI前瞻:量子AI、具身智能与科学发现的新纪元
08
CC-Switch & Claude 基于 Linux 服务器安装使用指南
09
2026 年 AI 编程助手全面对比评测:Cursor vs Copilot vs Claude Code vs GitHub Copilot Free
10
从限购到畅通:GLM-5.1 Coding Plan接入攻略