fp8 量化笔记

AI视觉网奇2026-04-02 8:35

你的 RTX 5060 Ti 依然属于 Ada Lovelace 架构 （消费级 GPU），和 RTX 5060 类似，它 没有 Hopper 架构的 FP8 Tensor Core。

FP8 张量运算目前 只在 NVIDIA Hopper GPU（H100）和部分 A100 Tensor Core 上得到硬件支持。

各代 GPU 精度支持总结：

架构 / 系列	FP32	FP16	BF16	INT8	FP8
30 系 (Ampere, 3060/3070/3080/3090)	✅	✅	❌（需要模拟）	✅	❌
40 系 (Ada Lovelace, 4060/4070/4080/4090)	✅	✅	❌（模拟）	✅	❌
50 系 (Ada Lovelace 消费级, 5060/5060 Ti)	✅	✅	❌	✅	❌
100 系 (Hopper, H100)	✅	✅	✅	✅	✅

上一篇：使用 Python 将图片转换为 PDF (含合并）

下一篇：【数学建模 matlab 实验报告2】

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？092026 年 AI 大模型 & AI 编程工具实战全总结 102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？