Mac M2 本地下载 Xinference

想要在Mac M2 上部署一个本地的模型。看到了Xinference 这个工具

一、Xorbits Inference 是什么

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

本地部署参考了这两个文档

部署文档

欢迎来到 Xinference! --- Xinference

部署文档

接入 Xinference 部署的本地模型 | 中文 | Dify

二、本地部署

安装命令

pip install xinference

安装成功

硬件加速

CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

安装成功

启动(启动的时候,指定从魔搭上拉取模型。注意这里,国内的话用魔搭拉取会顺畅一些,国外的话可以不指定,取huggingface上去拉去模型)

XINFERENCE_MODEL_SRC=modelscope xinference-local --host 0.0.0.0 --port 9997

本地访问

http://0.0.0.0:9997
相关推荐
小路恢弘3 小时前
使用Mac自带共享实现远程操作
macos
阿髙11 小时前
macos 隐藏、加密磁盘、文件
macos
minos.cpp13 小时前
Mac上Stable Diffusion的环境搭建(还算比较简单)
macos·ai作画·stable diffusion·aigc
追光天使1 天前
Mac/Linux 快速部署TiDB
linux·macos·tidb
wzkttt1 天前
Mac gfortran编译fortran出错
macos·gfortran
刘小哈哈哈1 天前
iOS 多个输入框弹出键盘处理
macos·ios·cocoa
草明1 天前
macOS 显示或不显示隐藏文件
macos
刘贤松1 天前
构建MacOS应用小白教程(打包 & 签名 & 公证 & 上架)
macos
power_to_go1 天前
macOS 配置 vscode 命令行启动
ide·vscode·macos
南山十一少1 天前
在 Mac M2 上安装 PyTorch 并启用 MPS 加速的详细教程与性能对比
macos