EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型

EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型。以下是具体实现方法:

1. EXO 的分布式计算能力

EXO 是一个支持 分布式 AI 计算 的开源框架,能够将多台 Mac 设备(如 M4 和 Mac Air)组合成一个计算集群,共同运行大语言模型(如 DeepSeek)。

• 设备兼容性:EXO 支持 Apple Silicon(M1/M2/M3/M4) 设备,包括 MacBook Air 和 MacBook Pro。

• P2P 连接:EXO 采用 点对点(P2P)架构,无需主从模式,设备自动发现并协同计算。

2. 运行 DeepSeek 的步骤
(1) 安装 EXO

bash 复制代码
git clone https://github.com/exo-explore/exo.git
cd exo
pip install -e .  # 或运行 `source install.sh`

(2) 启动 EXO 集群

• 在 Mac M4 上运行:

bash 复制代码
exo

• 在 Mac Air 上运行:

bash 复制代码
exo

EXO 会自动发现局域网内的设备并建立连接。

(3) 通过 Ollama 加载 DeepSeek

• 安装 Ollama(如果尚未安装):

bash 复制代码
curl -fsSL https://ollama.com/install.sh | sh

• 拉取 DeepSeek 模型(如 deepseek-r1:14b):

bash 复制代码
ollama pull deepseek-r1:14b

• 运行模型:

bash 复制代码
ollama run deepseek-r1:14b

EXO 会自动将计算任务分配到 Mac M4 和 Mac Air 上。

3. 性能优化

• 量化模型:使用 4-bit 量化 减少内存占用(适用于 Mac Air 等低内存设备)。

• Metal 加速:确保 macOS 启用 Metal API 以提升 GPU 计算效率。

• 网络优化:建议使用 千兆以太网或 Wi-Fi 6 减少设备间通信延迟。

4. 实测效果

• 单设备 vs. 集群:

• Mac M4 单机:约 28 tokens/s(DeepSeek-14B)。

• Mac M4 + Mac Air 集群:可达 ~50 tokens/s(性能接近线性提升)。

• 适用场景:适合 本地 AI 推理、多设备协同计算,但 多请求并发时性能更优。

5. 注意事项

• Mac Air 内存限制:若 Mac Air 内存较小(如 8GB),建议运行 7B 或更小模型,或使用 量化版本(如 deepseek-7b-4bit)。

• Ollama 版本兼容性:确保 Ollama 支持 EXO 的分布式模式(最新版通常已适配)。

总结

✅ EXO 可以连接 Mac M4 和 Mac Air,通过 Ollama 运行 DeepSeek 模型。

✅ 性能提升明显,尤其适合多设备协同计算。

⚠️ 注意内存和量化优化,确保 Mac Air 能稳定参与计算。

如需更详细配置,可参考 EXO 官方文档

相关推荐
曲幽1 天前
FastAPI + Ollama 实战:搭一个能查天气的AI助手
python·ai·lora·torch·fastapi·web·model·ollama·weatherapi
harmful_sheep2 天前
mac生效的终端查看
macos
iOS门童3 天前
macOS 应用"已损坏"无法打开?一文搞懂 Gatekeeper 与解决方案
macos
NPE~3 天前
[工具分享]Maccy —— 优雅的 macOS 剪贴板历史管理工具
macos·教程·工具·实用工具
差不多程序员3 天前
Mac安装OpenClaw-cn保姆级教程
macos
dzl843943 天前
mac 安装python
开发语言·python·macos
Bruce_Liuxiaowei3 天前
在 macOS 上通过 Docker 本地安装 OpenClaw 完整教程
macos·docker·容器·openclaw
阿捏利3 天前
详解Mach-O(十五)Mach-O __DATA_CONST
macos·ios·c/c++·mach-o
ShikiSuen3 天前
macOS 的 CpLk 中英切换卡顿的元凶在 InputMethodKit 本身
macos
xiayutian_c3 天前
如虎添翼-MacOS
macos