Mac M2 本地下载 Xinference

想要在Mac M2 上部署一个本地的模型。看到了Xinference 这个工具

一、Xorbits Inference 是什么

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

本地部署参考了这两个文档

部署文档

欢迎来到 Xinference! --- Xinference

部署文档

接入 Xinference 部署的本地模型 | 中文 | Dify

二、本地部署

安装命令

复制代码
pip install xinference

安装成功

硬件加速

复制代码
CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

安装成功

启动(启动的时候,指定从魔搭上拉取模型。注意这里,国内的话用魔搭拉取会顺畅一些,国外的话可以不指定,取huggingface上去拉去模型)

复制代码
XINFERENCE_MODEL_SRC=modelscope xinference-local --host 0.0.0.0 --port 9997

本地访问

复制代码
http://0.0.0.0:9997
相关推荐
伊织code2 小时前
macOS - 根据序列号查看机型、保障信息
macos·mac·macbook·查看·序列号·机型·对应
韩曙亮5 小时前
【错误记录】Mac 命令行执行 brew 命令报错 ( Error: Failed to upgrade Homebrew Portable Ruby! )
redis·macos·ruby
程序员的世界你不懂8 小时前
MAC环境安装Appium+JAVA
macos·appium
蓝纹绿茶13 小时前
【本机已实现】使用Mac部署Triton服务,使用perf_analyzer、model_analyzer
人工智能·算法·macos·机器学习
丁学文武1 天前
Mac 安装ElasticSearch和Kibana详细教程
elasticsearch·macos·langchain·jenkins
2501_920552561 天前
Mac电脑 充电限制保护工具 AlDente Pro
macos·电脑·充电保护
2501_920552561 天前
Mac电脑 Office 2024 LTSC 长期支持版(Excel、Word、PPT)
macos·word·powerpoint·excel·mac
2501_915106322 天前
数据差异的iOS性能调试:设备日志导出和iOS文件管理
websocket·http·macos·ios·https·udp·cocoa
小远披荆斩棘2 天前
恢复MacOS 26系统后台的动作命令
macos
彬彬醤2 天前
TikTok for Mac?Mac用户的TikTok使用指南
大数据·网络·tcp/ip·web安全·macos·重构