技术栈

gemma-4-26b-a4b

碳基硅坊
2 小时前
人工智能·模型部署·gemma-4-26b-a4b
在Mac上跑26B大模型:M4 Max + MLX量化推理实测今天我们来聊聊在Mac Studio M4 Max(32核GPU)上,使用oMLX平台部署gemma-4-26B-A4B-it-QAT-MLX-4bit模型的真实性能表现。
我是有底线的