技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
m0_64188929
3 小时前
2026最新GEO优化效果监测分析工具实测:Top 5平台深度横评
人工智能
·
大模型
·
agent
·
品牌营销
·
geo
·
智能营销
·
geo优化
jeffer_liu
4 小时前
Spring AI 生产级实战:多模态
java
·
人工智能
·
后端
·
spring
·
大模型
InternLM
4 小时前
从「模型类型不支持」到成功推理:Intern-S2-Preview oMLX 4bit 量化实录 | 与书生共创
人工智能
·
大模型
·
多模态模型
小真zzz
4 小时前
GEO选型避坑实录:当“参考答案”是假的,如何找到“标准答案”?
大数据
·
人工智能
·
搜索引擎
·
ai
·
大模型
张彦峰ZYF
5 小时前
深入 LangGraph State:Reducer 是如何让状态“自动合并”的
人工智能
·
python
·
大模型
·
langgraph
汤姆yu
18 小时前
原生一体化多模态大模型技术研究
ai
·
大模型
·
多模态
·
智能体
小真zzz
1 天前
当“虚构的解决方案”成为试金石:搜极星如何将市场幻想变为可验证的现实?
搜索引擎
·
ai
·
大模型
·
deepseek
隔窗听雨眠
1 天前
基于大模型API的活动策划辅助系统设计与实现
人工智能
·
大模型
codefan※
1 天前
干掉幻觉实战:如何构建企业级知识图谱增强 RAG
人工智能
·
大模型
·
llm
·
知识图谱
·
neo4j
·
rag
·
graphrag
A-刘晨阳
1 天前
从数据到决策:TimechoAI时序大模型使用指南与深度时序分析能力解析
大模型
热门推荐
01
GitHub 镜像站点
02
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
03
【AI】2026 年具身智能模型和世界模型总结
04
Codex 下载安装指南:Windows 和 macOS 官方版下载
05
Codex 桌面端更新后 Chrome 插件和 Computer Use 不可用,怎么排查和修复
06
【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法
07
CC-Switch 下载、安装与使用配置指南【2026.5.29】
08
Codex 接入 DeepSeek API 完整配置文档
09
CC-Switch & Claude 基于 Linux 服务器安装使用指南
10
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法