技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
CoderJia程序员甲
5 小时前
GitHub 热榜项目 - 日榜(2026-1-1)
ai
·
开源
·
大模型
·
github
·
ai教程
星云数灵
6 小时前
大模型高级工程师考试练习题1
人工智能
·
大模型
·
大模型工程师
·
大模型考试题
·
大模型工程师练习题
·
大模型高频考题
Tadas-Gao
14 小时前
AI是否存在“系统一”与“系统二”?——从认知科学到深度学习架构的跨学科解读
人工智能
·
架构
·
系统架构
·
大模型
·
llm
keep_learning111
1 天前
Z-Image模型架构全解析
人工智能
·
算法
·
计算机视觉
·
大模型
·
多模态
CoderOnly
1 天前
【代码】下载COIG-CQIA数据集并转为alpaca jsonl/json格式
大模型
CoderJia程序员甲
1 天前
GitHub 热榜项目 - 日榜(2025-12-31)
开源
·
大模型
·
llm
·
github
·
ai教程
司南OpenCompass
1 天前
司南“六位一体”评测体系的一年演进
人工智能
·
大模型
·
多模态模型
·
大模型评测
·
司南评测
·
ai评测
KG_LLM图谱增强大模型
1 天前
OntoMetric:破解ESG报告难题的“大模型+本体知识图谱”新范式,准确率提升10倍
人工智能
·
大模型
·
知识图谱
喜欢吃豆
2 天前
OpenAI Realtime API 深度技术架构与实现指南——如何实现AI实时通话
人工智能
·
语言模型
·
架构
·
大模型
热门推荐
01
GitHub 镜像站点
02
jdk21下载、安装(Windows、Linux、macOS)
03
Linux下V2Ray安装配置指南
04
Claude Code Skills 实用使用手册
05
手把手教你通过Gemini3 pro 学生认证,白用一年,手慢无!
06
UV安装并设置国内源
07
2025 最新教程:注册并切换到美区 Apple ID
08
从快手“12·22”直播攻击事件看:一次教科书式的业务层饱和攻击
09
【踩坑笔记】50系显卡适配的 PyTorch 安装
10
祝大家 2026 年新年快乐,代码无 bug,需求一次过