【亲测】MaxKB如何对接 Xinference 大模型

现在市面上关于基于 LLM 大模型的开源 AI 知识库有很多,比如,Dify、FastGPT、MaxKB等。其中,体验下来,觉得MaxKB整体页面使用起来比较流畅,简单易操作,不仅支持国内外主流的大模型对接,还支持流程编排,虽然目前还不支持函数库,但它的更新速度是很快的,1个月一个版本,从官网可知在8月底就会出函数库功能。如果有个性化需求调用的,可以期待一下。

好了,话不多说,开始正文。

一、MaxKB 是什么?

官网可知,MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。

产品优势:

  • 开箱即用
    支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;
  • 无缝嵌入
    支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度;
  • 灵活编排
    内置强大的工作流引擎,支持编排 AI 工作流程,满足复杂业务场景下的需求;
  • 模型中立
    支持对接各种大语言模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型(通义千问 / 智谱 AI / 百度千帆 / Kimi / DeepSeek 等)和国外公共大模型(OpenAI / Azure OpenAI / Gemini 等)。

二、开始部署

查看官网文档,这里的部署方式也很简单,在这里不做过多的介绍了,如果不会的小伙伴可以去参考一下官网。
https://maxkb.cn/docs/installation/offline_installtion/

三、对接 Xinference 平台

3.1 在MaxKB找到模型设置

因为MakKB本身不支持Xinference平台接入,但提供了OpenAI的接入方式,恰好 Xinference 也是支持 OpenAI接口的,所以刚好也可以对接。

3.2 添加模型

点击"添加模型",这里参数注意。

API 域名:http://192.168.1.2:9997/v1/ (v1不能省略)

如果没有部署好xinference平台的,参考:如何部署xinference

填写完参数,点击"添加"按钮,即可添加成功。如果报错,检查网络或者所填写地址是否能否访问。

四、创建应用

添加好了模型,直接创建应用即可。

这里选择对应的模型即可使用。

五、总结

MaxKB作为国内开源私有化知识库搭建平台,有非常美观的操作页面和简单易懂的流程配置,还支持主流的模型对接,有着很大的潜力。

以上就是对接 Xinference 平台的操作步骤,欢迎讨论交流。

相关推荐
模型启动机7 小时前
Langchain正式宣布,Deep Agents全面支持Skills,通用AI代理的新范式?
人工智能·ai·langchain·大模型·agentic ai
七夜zippoe8 小时前
使用Ollama在消费级硬件上运行大模型:从环境配置到企业级实战
性能优化·大模型·模型量化·ollama
nju_spy1 天前
ToT与ReAct:突破大模型推理能力瓶颈
人工智能·大模型·大模型推理·tot思维树·react推理行动·人工智能决策·ai推理引擎
KG_LLM图谱增强大模型1 天前
[500页电子书]构建自主AI Agent系统的蓝图:谷歌重磅发布智能体设计模式指南
人工智能·大模型·知识图谱·智能体·知识图谱增强大模型·agenticai
WWZZ20251 天前
快速上手大模型:深度学习12(目标检测、语义分割、序列模型)
深度学习·算法·目标检测·计算机视觉·机器人·大模型·具身智能
世优科技虚拟人1 天前
2026数字展厅设计核心关键,AI数字人交互大屏加速智慧展厅升级改造
人工智能·大模型·数字人·智慧展厅·展厅设计
喜欢吃豆2 天前
使用 OpenAI Responses API 构建生产级应用的终极指南—— 状态、流式、异步与文件处理
网络·人工智能·自然语言处理·大模型
楚国的小隐士3 天前
Qwen是“源神”?实际上GLM-4.6才是被低估的黑马
ai·大模型·通义千问·智谱清言
程序员鱼皮3 天前
又被 Cursor 烧了 1 万块,我麻了。。。
前端·后端·ai·程序员·大模型·编程
north_eagle4 天前
RAG 同 Prompt Engineering
大模型·prompt·rag