技术栈

mlx

带娃的IT创业者
7 小时前
人工智能·macos·语言模型·mac·视觉语言模型·mlx·本地推理
MLX-VLM:在Mac上解锁视觉语言模型的本地推理与微调能力2024年,人工智能领域最令人兴奋的趋势之一,莫过于多模态大模型的普及。从GPT-5.5的多模态能力到Qwen3.6 Max的视觉理解,再到DeepSeek 4.0 Pro在图文交互上的突破,视觉语言模型(VLM)正在重塑我们与机器互动的方式。然而,这些强大的模型往往运行在昂贵的云端GPU集群上,对于个人开发者来说,无论是成本还是隐私都是难以逾越的门槛。
Mininglamp_2718
12 小时前
大模型·apple silicon·mlx·端侧推理·激活量化
在Mac上跑大模型,MLX 不是终点当 Apple MLX 框架让开发者第一次在 MacBook 上流畅运行 7B 模型时,整个社区为之振奋。但冷静下来看数据:MLX 的 W4A16 量化方案在 prefill 阶段的计算密度远未触及 Apple Silicon 的理论上限。权重被压缩到了 4-bit,激活值却依然以 FP16 参与矩阵运算——这意味着 GPU 核心中一半以上的 ALU 周期被浪费在了不必要的精度上。
我是有底线的