EXO 可以将 Mac M4 和 Mac Air 连接起来，并通过 Ollama 运行 DeepSeek 模型

EXO 可以将 Mac M4 和 Mac Air 连接起来，并通过 Ollama 运行 DeepSeek 模型。以下是具体实现方法：

1. EXO 的分布式计算能力

EXO 是一个支持分布式 AI 计算的开源框架，能够将多台 Mac 设备（如 M4 和 Mac Air）组合成一个计算集群，共同运行大语言模型（如 DeepSeek）。

• 设备兼容性：EXO 支持 Apple Silicon（M1/M2/M3/M4）设备，包括 MacBook Air 和 MacBook Pro。

• P2P 连接：EXO 采用点对点（P2P）架构，无需主从模式，设备自动发现并协同计算。

2. 运行 DeepSeek 的步骤
(1) 安装 EXO

bash 复制代码

git clone https://github.com/exo-explore/exo.git
cd exo
pip install -e .  # 或运行 `source install.sh`

(2) 启动 EXO 集群

• 在 Mac M4 上运行：

bash 复制代码

exo

• 在 Mac Air 上运行：

bash 复制代码

exo

EXO 会自动发现局域网内的设备并建立连接。

(3) 通过 Ollama 加载 DeepSeek

• 安装 Ollama（如果尚未安装）：

bash 复制代码

curl -fsSL https://ollama.com/install.sh | sh

• 拉取 DeepSeek 模型（如 deepseek-r1:14b）：

bash 复制代码

ollama pull deepseek-r1:14b

• 运行模型：

bash 复制代码

ollama run deepseek-r1:14b

EXO 会自动将计算任务分配到 Mac M4 和 Mac Air 上。

3. 性能优化

• 量化模型：使用 4-bit 量化减少内存占用（适用于 Mac Air 等低内存设备）。

• Metal 加速：确保 macOS 启用 Metal API 以提升 GPU 计算效率。

• 网络优化：建议使用千兆以太网或 Wi-Fi 6 减少设备间通信延迟。

4. 实测效果

• 单设备 vs. 集群：

• Mac M4 单机：约 28 tokens/s（DeepSeek-14B）。

• Mac M4 + Mac Air 集群：可达 ~50 tokens/s（性能接近线性提升）。

• 适用场景：适合本地 AI 推理、多设备协同计算，但多请求并发时性能更优。

5. 注意事项

• Mac Air 内存限制：若 Mac Air 内存较小（如 8GB），建议运行 7B 或更小模型，或使用量化版本（如 deepseek-7b-4bit）。

• Ollama 版本兼容性：确保 Ollama 支持 EXO 的分布式模式（最新版通常已适配）。

总结

✅ EXO 可以连接 Mac M4 和 Mac Air，通过 Ollama 运行 DeepSeek 模型。

✅ 性能提升明显，尤其适合多设备协同计算。

⚠️ 注意内存和量化优化，确保 Mac Air 能稳定参与计算。

如需更详细配置，可参考 EXO 官方文档