技术栈

大模型轻量化

祁_z
2 小时前
算法·机器学习·剪枝·量化·蒸馏·大模型轻量化
大模型轻量化:模型格式选型(ONNX/GGUF/TFLite) + 压缩三剑客(量化/剪枝/蒸馏)+ 大模型推理执行流程介绍三种大模型部署时用的文件格式 / 载体:ONNX、GGUF与TFLite。真实场景应基于部署设备去选择模型:
我是有底线的