在本地windows电脑使用Docker搭建xinference环境

在本地windows电脑使用Docker搭建xinference环境

  • [1. 整体描述](#1. 整体描述)
  • [2. 前期准备](#2. 前期准备)
    • [2.1 Docker安装](#2.1 Docker安装)
    • [2.2 Xinference网站](#2.2 Xinference网站)
  • [3. Xinference安装](#3. Xinference安装)
    • [3.1 选择类型](#3.1 选择类型)
    • [3.2 具体安装](#3.2 具体安装)
    • [3.3 启动页面](#3.3 启动页面)
  • 总结

1. 整体描述

Xorbits Inference (Xinference) 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,并创建强大的 AI 应用。

2. 前期准备

2.1 Docker安装

在本地安装Docker Desktop,可以参考这个文章:在本地windows电脑搭建Dify环境

2.2 Xinference网站

这里把Xinference相关网站附上,以便查询相关资料

github地址:github地址

官方文档地址:官方文档地址

3. Xinference安装

3.1 选择类型

安装分为GPU加速版本和CPU版本,根据自己电脑选择,我这电脑没有GPU,就选择CPU版本。

3.2 具体安装

执行如下cmd命令:

bash 复制代码
docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 xprobe/xinference:latest-cpu xinference-local -H 0.0.0.0 --log-level debug

执行之后,会自动进入下载,等待...

等待安装完成,在Docker Desktop上会有:

3.3 启动页面

点击启动按钮,运行容器,然后访问页面:http://localhost:9998/

会进入xinference的页面。

总结

至此,xinference就安装完成了,和Ollama相比,xinference多模态全覆盖:支持文本生成(LLM)、Embedding(如BGE、E5)、Rerank、语音合成(TTS)、语音识别(STT)等任务,Ollama基本都是LLM语言模型。

相关推荐
专业白嫖怪5 小时前
什么是docker
运维·docker·容器
如此这般英俊9 小时前
手撕Claude Code—第一章 agent-loop
数据结构·人工智能·语言模型·自然语言处理
qq_452396239 小时前
第十篇:《Dockerfile 最佳实践与镜像瘦身》
docker
Plastic garden9 小时前
Docker(1)
运维·docker·容器
gs8014010 小时前
网络隐形杀手:从 Could not connect to SMTP host 报错深度剖析 Docker MTU 黑洞理论与实战
网络·docker·容器
程序猿阿伟11 小时前
《一套完整方法论:搞定图形应用的Docker镜像优化》
数据库·docker·容器
java_logo12 小时前
2026 Docker 国内镜像加速配置教程
运维·docker·容器·docker镜像·docker镜像源·docker镜像加速·docker镜像国内库
纤纡.13 小时前
阿里云 DSW 实战:从零完成 Qwen3-4B 大模型 LoRA 微调全流程
人工智能·阿里云·语言模型·云计算
IT策士13 小时前
Docker从0到1再到 Kubernetes 实战:第15篇Compose 中的服务依赖、健康检查与启动顺序
docker·容器·kubernetes
Waay13 小时前
K8s Deployment 滚动更新与回滚深度详解(含踩坑实录+生产选型原理)
云原生·容器·kubernetes