LLM交互工具汇总:Open WebUI、ChatBot-UI、浏览器插件、Studio

最初,Ollama是不带聊天UI功能的,和模型对话需要在命令行下进行,能完成Ollama部署并下载模型,一般也不会排斥命令行,但多多少少没有ChatGPT这种GUI来得自然,于是诞生各种GUI交互项目。本文试图汇总并学习。

Open WebUI

Open WebUI,以前称为Ollama WebUI,官网,一款专为LLM设计的用户友好的开源(GitHub,117K Star,16.4K Fork)可视化交互工具,通过类ChatGPT的直观界面,让用户无需代码即可训练、管理、调试和调用本地或云端LLM。官方文档

通过可视化交互与大模型技术结合,成为私有化部署的标杆工具。开箱即用的特性适合开发者快速验证模型、企业构建合规AI平台及个人用户探索AI应用。随着插件生态的扩展(如视频生成、语音交互),未来可进一步降低多模态应用的开发门槛。

特点:

  • 直观交互体验:提供类似ChatGPT的自然语言对话界面,支持Markdown和LaTeX渲染、代码高亮显示,提升内容可读性;
  • 多轮对话管理:内置对话历史记录功能,用户可随时回顾上下文,避免重复输入,确保对话连贯性;
  • 全平台兼容性:采用响应式设计,桌面端和移动端界面均能自适应屏幕尺寸,提供一致的使用体验;
  • 多模型多模型支持:无缝切换不同文生文、文生图模型;
  • 低门槛操作:通过简化交互流程和优化视觉设计,大幅降低非技术用户的使用难度,真正实现零学习成本上手;
  • 命令支持:通过#命令加载文档或添加文件,使用/命令快速访问预设提示。
  • 功能丰富:支持RAG(检索增强生成)、多模态输入(文本、图片)、网络搜索等高级功能。支持对话标签和历史管理、提示词模板、上下文连续对话等实用功能。
模块 能力 价值
模型管理 多后端支持、模型下载/切换/加载、参数实时调整 统一管理入口,灵活适配不同场景
交互体验 类ChatGPT界面、代码高亮、Markdown渲染、多会话管理、响应式设计、PWA 支持、多语言界面 降低使用门槛,提供流畅体验
知识管理 文档上传、知识库构建、语义+网络搜索、文档处理流水线、上下文增强 利用私有数据提升回答准确性
高级功能 工具调用、Web搜索集成、提示词工作流、多模态支持、代码执行、图像生成、音频处理(ASR/TTS) 扩展模型能力边界,实现任务自动化
用户管理 多用户系统、角色权限控制、团队协作 满足企业级部署需求
身份认证 OAuth2、LDAP、基于角色的访问控制(RBAC)、SCIM 2.0 保障数据安全
部署隐私 全离线、自托管、Docker容器化、数据本地存储 彻底掌控数据,保障隐私安全
企业级功能 细粒度权限、用户组、审计日志、Webhook 企业生产实践

采用现代全栈架构,前端和后端组件之间职责分明:

核心技术栈

  • 前端技术:
    • SvelteKit 2.5.20:提供服务器端渲染和客户端导航的现代Web框架
    • TailwindCSS 4.0:实用优先的CSS响应式设计框架
    • TypeScript 5.5.4:类型安全的JS开发语言
    • Vite 5.4.14:高性能构建工具和开发服务器
  • 后端技术
    • FastAPI 0.118.0:高性能Web框架
    • Uvicorn 0.37.0:Web应用的ASGI服务器
    • SQLAlchemy 2.0.38:SQL工具包和对象关系映射库
    • Redis:用于缓存和会话的内存数据结构存储
    • WebSocket:实时双向通信协议

实战

支持多种安装方式:

  • pip
  • Docker

通过pip安装:

bash 复制代码
pip install open-webui
open-webui serve
# 完全离线运行而不去尝试从网络上下载模型
set HF_HUB_OFFLINE=1 & open-webui serve

通过Docker方式

bash 复制代码
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

改成3001端口,是因为与本地其他应用占用的3000端口冲突。

集成Ollama

发起提问:

Open WebUI支持通过OpenAI API兼容接口接入多种LLM:

  • 本地部署的模型(如vLLM、Transformers运行的模型)
  • 云端API服务(如OpenAI GPT-4等)

mcpo

开源(GitHub,3.7K Star,417 Fork)工具,可将mcp服务转换为Open API的代理服务。

安装:pip install mcpo

ChatBot-UI

Takeoff AI团队开源(GitHub,32.7K Star,9.4K Fork),官网

实战

bash 复制代码
git clone https://github.com/mckaywrigley/chatbot-ui.git
npm install
# Windows安装supabase
scoop bucket add supabase https://github.com/supabase/scoop-bucket.git
scoop install supabase
# Mac安装supabase
brew install supabase/tap/supabase
# 启动supabase
supabase start
cp .env.local.example .env.local
vim .env.local # 编辑APIKey
# 启动界面
npm run chat

浏览器打开http://localhost:3000开始体验聊天功能,支持本地Ollama模型。

对supabase不熟悉或感兴趣,请参考BaaS(Backend as a Service)概述、平台、项目

轻量级

设置Supabase什么的,略微麻烦。于是该项目作者又开源(GitHub,985 Star,240 Fork)ChatBot-UI的轻量级版本。

本地部署:

bash 复制代码
git clone https://github.com/mckaywrigley/chatbot-ui-lite.git
npm i
OPENAI_API_KEY=xx
npm run dev
复制代码
复制代码

浏览器插件

Page Assist

开源(GitHub,7.3K Star,673 Fork)浏览器插件,提供界面与LLM进行问答交互。Chrome插件地址

Chrome浏览器抽风,连接11434端口失败,折腾将近2小时,没搞定:

在被搞得快崩溃时,才想到试试Edge(怪自己重度使用并依赖于Chrome和Google)。

Edge为了吸引Chrome用户,向Chrome看齐,地址栏输入edge://extensions管理扩展(包括:查看已安装、搜索、卸载等),搜索Page

安装流程和Chrome无差别,界面如下:

功能和按钮非常一目了然,但我还是很详细说明。模型列表如下:

下面已经有基础的文生文问答。实时ASR自动语音识别,之前下载过Whisper模型,输入中文,只能识别英文:

仅44M大小的dimavz/whisper-tiny:latest,识别效果还是很不错的:

注意,Whisper不能用于问答:

不过仅1B参数量,明显是在胡说八道:

如上,几个功能按钮:朗读、复制、信息、重新生成、新分支、继续响应、编辑。

对话复制或导出:

再来看看设置:

分别是:

  • 通用设置
  • 流水线设置:
  • Ollama设置:
  • Chrome AI设置:
  • OpenAI兼容API:
  • 模型管理:
  • 知识库管理:
  • 提示词管理:
  • 分享管理:
  • 关于:

Chrome AI:

模型列表:

新增Ollama模型:

新增自定义模型,功能还不完善?

添加知识,支持上传文件和粘帖文本,类型支持纯文本、Markdown、Code:

提示词:

当前对话模型设置,部分截图:

对OpenAI开源的Whisper感兴趣,可参考:

ollama-ui

又一款开源(GitHub,1.1K Star,179 Fork)插件,Chrome插件地址,不会科学上网,可选择在线体验

打开控制台,查看接口请求:

果然是跨域问题。但是直接打开http://127.0.0.1:11434/api/tags,输出正常

按照上面提示,设置系统变量OLLAMA_ORIGINS=*,推出Ollama。再次在终端输入ollama ps自动拉起Ollama进程,Ollama GUI上发起Query,自动拉起模型。浏览器刷新页面:

根据Ollama暴露的API接口,获取模型列表,选择一个推理(聊天)模型,如gemma3:1b

效果如下:

注意,Edge浏览器可以正常打开http://127.0.0.1:11434,Chrome浏览器打开有问题:

Chrome浏览器,什么鬼?

Studio类工具

包括开源和闭源两大类,通过提供便捷的exemsi程序或压缩包(Portable版,解压缩即可用),傻瓜式安装;不过使用还是需要自行摸索研究下;已经不仅仅只是一个聊天交互工具,还提供各种功能。

Cherry Studio

参考Cherry Studio实战使用

LM Studio

TODO,准备写一篇。

Msty Studio

官网

参考

相关推荐
0***863314 小时前
SQL Server2019安装步骤+使用+解决部分报错+卸载(超详细 附下载链接)
javascript·数据库·ui
Apeng_091919 小时前
ui-picture-bd-marker实现图片标注功能
ui·vue
晚霞的不甘21 小时前
社区、标准与未来:共建 Flutter 与 OpenHarmony 融合生态的可持续发展路径
安全·flutter·ui·架构
Aevget21 小时前
从业务面板到多视图协同:QtitanDocking如何驱动行业级桌面应用升级
c++·qt·ui·ui开发·qt6.3
赵财猫._.1 天前
【Flutter x 鸿蒙】第三篇:鸿蒙特色UI组件与Flutter的融合使用
flutter·ui·harmonyos
CodeCraft Studio1 天前
Excel处理控件Aspose.Cells教程:使用C#在Excel中创建漏斗图
ui·c#·excel·aspose·excel开发·excel漏斗图·漏斗图
seven_7678230981 天前
MateChat自然语言生成UI(NLG-UI):从描述到可交互界面的自动生成
ui·交互·devui·matechat
crary,记忆1 天前
如何理解 React的UI渲染
前端·react.js·ui·前端框架
xun_xin6661 天前
QWidget for C++:ui资源使用
ui