技术栈
大模型轻量化
祁_z
2 小时前
算法
·
机器学习
·
剪枝
·
量化
·
蒸馏
·
大模型轻量化
大模型轻量化:模型格式选型(ONNX/GGUF/TFLite) + 压缩三剑客(量化/剪枝/蒸馏)+ 大模型推理执行流程介绍
三种大模型部署时用的文件格式 / 载体:ONNX、GGUF与TFLite。真实场景应基于部署设备去选择模型:
我是有底线的