技术栈
gemma-4-26b-a4b
碳基硅坊
2 小时前
人工智能
·
模型部署
·
gemma-4-26b-a4b
在Mac上跑26B大模型:M4 Max + MLX量化推理实测
今天我们来聊聊在Mac Studio M4 Max(32核GPU)上,使用oMLX平台部署gemma-4-26B-A4B-it-QAT-MLX-4bit模型的真实性能表现。
我是有底线的