技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
卷Java
6 小时前
2026年4月AI军备竞赛全景:DeepSeek V4 vs GPT-5.5 vs Gemini vs Claude
人工智能
·
gpt
·
大模型
xixixi77777
8 小时前
AI的“账号”与“钱包”:AWS与Circle同日出手,AI正从工具进化
人工智能
·
安全
·
ai
·
大模型
·
云计算
·
aws
小李子呢0211
12 小时前
大模型是什么?
大模型
·
agent
无敌昊哥战神
12 小时前
大模型(LLM)推理优化技术全景总结
python
·
算法
·
大模型
Fleshy数模
12 小时前
基于 LangChain 实现 PDF 文档检索:从加载到向量检索全流程
人工智能
·
数据挖掘
·
langchain
·
大模型
Li_yizYa
13 小时前
【大模型篇】谈谈对于Function Calling、MCP、Skill的理解
ai
·
大模型
ZGi.ai
14 小时前
私有化大模型接入企业系统:SSO+权限+API网关完整方案
java
·
开发语言
·
大模型
·
私有化部署
·
sso
·
企业架构
门豪杰
15 小时前
2026年4月,我调研了15款主流大模型
ai
·
大模型
·
平台选择
DogDaoDao
15 小时前
【GitHub】NousResearch/Hermes-Agent 深度技术解析:自我进化的AI Agent新范式
人工智能
·
深度学习
·
程序员
·
大模型
·
github
·
ai编程
·
ai agent
key_3_feng
17 小时前
大模型基础优化实战指南
大模型
热门推荐
01
GitHub 镜像站点
02
Codex 接入 DeepSeek API 完整配置文档
03
CC-Switch & Claude 基于 Linux 服务器安装使用指南
04
【AI】2026 年具身智能模型和世界模型总结
05
零基础教你claude code 接入 deepseek V4
06
AI科技热点日报 | 2026年5月11日
07
codex app每次打开重连5次Reconnecting问题解决
08
人工智能最新动态 AI 日报 · 2026年5月10日
09
Cursor 接入 DeepSeek‑V4‑Pro 完整指南(2026 实测)
10
Gemini大升级、AI眼镜首发、Android XR亮相,13天后见分晓