技术栈
mlx
带娃的IT创业者
7 小时前
人工智能
·
macos
·
语言模型
·
mac
·
视觉语言模型
·
mlx
·
本地推理
MLX-VLM:在Mac上解锁视觉语言模型的本地推理与微调能力
2024年,人工智能领域最令人兴奋的趋势之一,莫过于多模态大模型的普及。从GPT-5.5的多模态能力到Qwen3.6 Max的视觉理解,再到DeepSeek 4.0 Pro在图文交互上的突破,视觉语言模型(VLM)正在重塑我们与机器互动的方式。然而,这些强大的模型往往运行在昂贵的云端GPU集群上,对于个人开发者来说,无论是成本还是隐私都是难以逾越的门槛。
Mininglamp_2718
12 小时前
大模型
·
apple silicon
·
mlx
·
端侧推理
·
激活量化
在Mac上跑大模型,MLX 不是终点
当 Apple MLX 框架让开发者第一次在 MacBook 上流畅运行 7B 模型时,整个社区为之振奋。但冷静下来看数据:MLX 的 W4A16 量化方案在 prefill 阶段的计算密度远未触及 Apple Silicon 的理论上限。权重被压缩到了 4-bit,激活值却依然以 FP16 参与矩阵运算——这意味着 GPU 核心中一半以上的 ALU 周期被浪费在了不必要的精度上。
我是有底线的