技术栈
大模型量化方案
a flying bird
2026-01-02 9:31
null
https://zhuanlan.zhihu.com/p/6281447174
大模型量化概述
量化感知训练:
大模型量化感知训练技术原理:LLM-QAT
大模型量化感知微调技术原理:QLoRA
训练后量化:
大模型量化技术原理:GPTQ、LLM.int8()
大模型量化技术原理:SmoothQuant
大模型量化技术原理:AWQ、AutoAWQ
大模型量化技术原理:SpQR
大模型量化技术原理:ZeroQuant系列
大模型量化技术原理:FP8
大模型量化技术原理:FP6
大模型量化技术原理:KIVI、IntactKV、KVQuant
大模型量化技术原理:Atom、QuaRot
大模型量化技术原理:QoQ量化及QServe推理服务系统
大模型量化技术原理:FP4
大模型量化技术原理:总结
大模型
量化
上一篇:
bash前面的(base)实现的原理
下一篇:
技能学习的隐形陷阱:理论过载(Theory Overload)与高效学习框架
相关推荐
重生之我要成为代码大佬
2 小时前
HuggingFace生态实战:从模型应用到高效微调
人工智能
·
python
·
大模型
·
huggingface
·
模型微调
一只小阿乐
6 小时前
vue前端处理流式数据
前端
·
javascript
·
ai
·
大模型
·
全栈开发
·
agentai
小碗羊肉
8 小时前
【AI】大语言模型是如何记住上下文的?
人工智能
·
大模型
翼龙云_cloud
9 小时前
阿里云代理商:如何基于百炼模型数据构建企业级智能分析平台?
阿里云
·
大模型
·
云计算
前进的李工
10 小时前
SSH隧道实现Dify与Ollama跨服务器通信
开发语言
·
大模型
·
github
·
腾讯云
·
autodl
·
dify
笨小古
11 小时前
VLA学习笔记——持续更新中
学习
·
机器人
·
大模型
·
具身智能
·
vla
Circ.
11 小时前
wsl部署deerflow实现调用自定义的skill(demo级别调用)
python
·
大模型
·
deerflow
Trouvaille ~
11 小时前
零基础入门 LangChain 与 LangGraph(一):理解大模型、提示词、Embedding 和接入方式
算法
·
langchain
·
大模型
·
embedding
·
rag
·
langgraph
·
llm应用
ModelHub XC信创模盒
21 小时前
中国信创AI生态下 “信创模盒”社区战略招募种子用户
人工智能
·
大模型
·
开发者
·
信创
·
算力
guslegend
1 天前
Ollama
人工智能
·
大模型
热门推荐
01
GitHub 镜像站点
02
2026年3月AI领域大事件:DeepSeek引领开源风暴
03
Qwen3.5-Omni与Qwen3.6模型全面解析(含测评/案例/使用教程)
04
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
05
AI 编程效率翻倍:Superpowers Skills 上手清单 + 完整指南
06
让 Trae IDE 智能体 “读懂”文档 Excel+PDF+DOCX :mcp-documents-reader 工具使用指南
07
Mac 本地部署 OMLX + 通义千问 Qwen3.5-27B 保姆级教程
08
UV安装并设置国内源
09
深扒 Claude Code Buddy 模式:一只仙人掌背后的确定性随机算法
10
如何解决 OpenClaw “Pairing required” 报错:两种官方解决方案详解