Mac M2 本地下载 Xinference

想要在Mac M2 上部署一个本地的模型。看到了Xinference 这个工具

一、Xorbits Inference 是什么

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

本地部署参考了这两个文档

部署文档

欢迎来到 Xinference! --- Xinference

部署文档

接入 Xinference 部署的本地模型 | 中文 | Dify

二、本地部署

安装命令

复制代码
pip install xinference

安装成功

硬件加速

复制代码
CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

安装成功

启动(启动的时候,指定从魔搭上拉取模型。注意这里,国内的话用魔搭拉取会顺畅一些,国外的话可以不指定,取huggingface上去拉去模型)

复制代码
XINFERENCE_MODEL_SRC=modelscope xinference-local --host 0.0.0.0 --port 9997

本地访问

复制代码
http://0.0.0.0:9997
相关推荐
风吹草地现牛羊的马12 小时前
mac m1/m2/m3 pyaudio的安装
深度学习·macos·自然语言处理·#pyaudio
文公子WGZ12 小时前
Razer macOS v0.4.10快速安装
macos
Macle_Chen17 小时前
XCode中使用MonkeyDev开发iOS版的Comand-line Tool的daemon程序
macos·ios·xcode·逆向·comand-line
Unlimitedz21 小时前
iOS GCD
macos·ios·cocoa
Unlimitedz1 天前
深入探索 iOS 卡顿优化
macos·ios·cocoa
Alger_Hamlet1 天前
Final Cut Pro X for Mac fcpx音视频剪辑编辑
macos
小雅痞1 天前
[Mac]利用Hexo+Github Pages搭建个人博客
macos·hexo·github.io
coding随想1 天前
macOS (M1 Pro) 上 Docker Desktop 安装失败问题及其解决方案
macos·docker·容器
coding随想2 天前
解决 macOS (M1 Pro) 上使用 Vite 进行 Build 打包时 Node 进程内存溢出的问题
macos·node.js
Tee xm2 天前
清晰易懂的Rust安装与配置教程
linux·windows·macos·rust