model_optimizer使用实践----------分析pi05 nvfp4量化后精度下降明显的问题

背景

model_optimizer

对pi05的llm模型进行nvfp4量化后,精度下降明显.

分析过程

上一篇文章介绍了model_optimizer推理性能可视化的功能

利用其逐渐修改nvfp4的量化配置,采用类似二分法查找精度敏感层。

修改量化配置后利用其对比功能跑修改后量化模型与量化前模型,进行对比。并利用可视化界面和数值统计很快就找到敏感层。

然后对敏感层使用fp8量化后,精度达标。后又尝试缩小fp8量化的layer,逐渐找到了最优的nvfp4+fp8混合量化配置。

因为项目文档有详细说明如何使用。因此如果有对项目和具体分析流程感兴趣的同学,我再进一步分享。

相关推荐
henrylin99991 天前
美股-后端服务模块
量化·美股
学Linux的语莫1 天前
大模型量化知识总结
人工智能·模型·量化
henrylin99992 天前
美股项目设计--数据管线模块
量化·美股
是阿千呀!3 天前
A股市场风格切换研究:基于 Barra 风险模型的量化框架
python·量化
henrylin99993 天前
美股日线选股器 — 项目概览
python·量化·us_stock
李可以量化3 天前
自建量化回测系统完全指南 (上):四大技术栈与主流开源框架深度对比
量化交易·量化·qmt·ptrade
李可以量化5 天前
量化迅投 QMT vs 聚宽 (JoinQuant)全面分析
python·量化·qmt·ptrade·聚宽
李可以量化7 天前
量化之MiniQMT 实战:一键读取通达信自选股并实时监控涨跌幅(附完整可运行代码)
开发语言·python·量化·qmt·ptrade
李可以量化7 天前
MiniQMT 量化实战:尾盘交易系统
量化·qmt
李可以量化10 天前
QMT 实战:自定义绘制专属 K 线(下篇)—— 国产库与高性能库全解析
python·信息可视化·数据分析·量化·qmt·ptrade