Windows10本地部署Dify+Xinference

目录

前言

一、安装必要项

1.安装Docker和AnaConda

2.安装Xinference

3.通过Xinference部署本地glm4-chat-1m

4.验证glm4-chat-1m是否部署完成

5.安装Dify

三、Dify中配置大模型

1.浏览器输入http://localhost:80启动Dify页面

2.随便注册账户登录

3.配置Xinference

四、运行Dify

1.设置系统推理模型

2.对话窗口验证

总结


前言

本文档在基于Windows10的本地电脑上部署使用Dify,其中必要用到的Xinference大模型管理框架,使用的大模型为GLM4-Chat-1m。

前置条件:确保已安装Anaconda、Python、Cuda。

一、安装必要项

1.安装Docker和AnaConda

Docker: Accelerated Container Application Developmenthttps://www.docker.com/

下载 Anaconda Distribution |蟒蛇https://www.anaconda.com/download

2.安装Xinference

打开Anaconda命令行页面

输入命令:

  • conda create --name xinference python==3.12
  • conda activate xinference
  • pip install xinferencetransformers
  • pip install xinferencevllm,有问题,只装transformers也行
  • xinference-local --host 本机IPV4地址 --prot 9997(ps:查询本机IP:cmd输入ipconfig)

浏览器输入本机IP:9997后如下图:

3.通过Xinference部署本地glm4-chat-1m

4.验证glm4-chat-1m是否部署完成

5.安装Dify

官网下载源码https://github.com/langgenius/dify,例如下载到D:\dify

打开cmd,执行以下代码

  • cd D:\dify\docker
  • docker compose up -d

Docker中查看是否部署成功,启动即可

三、Dify中配置大模型

1.浏览器输入http://localhost:80启动Dify页面

2.随便注册账户登录

3.配置Xinference

前置条件:Xinference正常运行中

点击右上角头像---设置---模型供应商---XorbitsInference---添加模型

  • 模型类型选择LLM
  • 模型名称随便填,自己看的
  • 服务器URL填写Xinference的IPV4地址+端口:http://192.168.0.167:9997
  • 模型UID填写Xinference中的模型ID:glm4-chat-1m
  • 选择保存

四、运行Dify

1.设置系统推理模型

2.对话窗口验证


总结

以上就是在Windows 10环境下部署本地的Dify和Xinference,因为笔者是玩Unity出身,当前只是业余时间研究,有问题欢迎指正和探讨~

相关推荐
垚森8 小时前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
doiito11 小时前
【Agent Harness】Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
ai·rust·架构设计·系统设计·ai agent
doiito1 天前
【Agent Harness】Gliding Horse 上下文动态感知与智能压缩:让 Agent 真正“听得进”每一句话
ai·rust·架构设计·系统设计·ai agent
探索云原生2 天前
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了
ai·云原生·kubernetes
Zy宇2 天前
从养 OpenClaw 到养社区 AI:一套 Multi-Agent 社区的设计思路
人工智能·ai
doiito3 天前
【Agent Harness】Gliding Horse 记忆系统深度剖析:像 CPU 一样思考的 AI 记忆架构
ai·rust·架构设计·系统设计·ai agent
mobility3 天前
免费AI视频生成器:我如何用零成本做出带旁白字幕的多场景AI视频
ai·vibe coding
doiito3 天前
【Agent Harness】Gliding Horse 给 Agent OS 装上双曲空间引擎与默克尔树边云同步
ai·rust·架构设计·系统设计·ai agent
knqiufan3 天前
从 Python 到 TypeScript,用 GLM-5.2 跑通 PowerMem SDK 的长程任务工程
ai·memory·agentic·powermem
小白跃升坊4 天前
Codex 增强部署:基于 Codex++ 接入 DeepSeek
ai·ai编程·codex·deepseek·ai coding·codex++