gemma-4-26b-a4b - gemma-4-26b-a4b技术,学习,经验文章

碳基硅坊

1 个月前

在Mac上跑26B大模型：M4 Max + MLX量化推理实测今天我们来聊聊在Mac Studio M4 Max（32核GPU）上，使用oMLX平台部署gemma-4-26B-A4B-it-QAT-MLX-4bit模型的真实性能表现。