技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
aqi00
5 天前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能
·
python
·
大模型
·
ai编程
·
ai应用
aqi00
6 天前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能
·
python
·
大模型
·
ai编程
·
ai应用
vivo互联网技术
8 天前
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像
算法
·
大模型
·
cvpr
·
影像
AndrewHZ
9 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能
·
语言模型
·
大模型
·
llm
·
cot
·
思维链
·
icl
Vergelight
9 天前
实战拆解|三类RAG架构差异:朴素、进阶、多轮RAG落地选型指南
架构
·
大模型
·
aigc
·
agent
·
ai产品经理
·
转行
·
ai后台设计
问道飞鱼
9 天前
【大模型相关】意图识别实现方案行业分析报告
大模型
·
意图识别
DogDaoDao
9 天前
【GitHub】CL4R1T4S:AI 系统提示词的透明革命
人工智能
·
python
·
ai
·
大模型
·
github
·
ai agent
·
cl4r1t4s
文艺倾年
10 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能
·
分布式
·
大模型
·
强化学习
·
vibecoding
IRevers
10 天前
【大模型】Gemma4在ROCm和vLLM部署
人工智能
·
pytorch
·
深度学习
·
大模型
·
datawhale
·
vllm
·
amdev
张彦峰ZYF
10 天前
从嵌入、表征到潜空间:理解大模型向量世界的三种视角
人工智能
·
大模型
·
向量空间
热门推荐
01
2026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?
02
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
03
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
04
【AI】2026 年具身智能模型和世界模型总结
05
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
06
飞书长连接_事件订阅(接收消息,审批任务状态变更)
07
GitHub 镜像站点
08
Trae国际版与国内版深度测评:AI原生IDE的双生花
09
【AI总结】2026年6月 主流国内外大模型总结
10
AI科技热点日报 | 2026年6月1日