一、前言
今天没有新增 AI 业务功能,也没有重构核心逻辑,只做了一件事:给商助慧 Admin 后台补上了三个 "工程化细节"。
很多人做项目,写完业务接口就结束了,但真正支撑项目长期迭代的,恰恰是这些 "看不见的运维能力"。这篇复盘,记录我如何用三个页面,把系统的可维护性、可调试性拉到了生产可用级别。
二、项目背景:为什么必须补运维模块?
在之前的开发和排查过程中,我遇到了几个非常典型的 "运维痛点":
- 每次排查问题,都要 SSH 登服务器,手动找日志文件、敲命令下载,效率极低;
- 调试后台权限接口时,本地 Postman 配置 Token、跨域问题频发,经常出现 401 拦截;
- 想快速确认 MySQL、Redis、Milvus、Ollama 这些中间件是否正常,只能靠一个个命令手动测试。
这些问题看似不影响业务功能,但会大幅拉低开发、联调、排障的效率,也让项目距离 "可交付" 差了关键一步。
三、落地的三个核心运维页面(100% 可用)
1. 服务健康监控页面
核心价值:可视化展示全链路服务状态,一眼判断服务是否正常。
- 展示项:Java 主服务、MySQL、Redis、Milvus 向量库、Ollama AI 服务
- 核心能力:一键刷新状态、服务运行结果可视化(UP/OK 状态标识)
- 解决痛点:不用再手动敲命令测试每个中间件,所有状态一目了然。

2. 日志下载页面
核心价值:免登服务器,直接在后台下载日志文件。
- 核心能力:日志列表展示、一键下载
.log文件 - 解决的关键坑:
- 多模块项目日志路径不匹配问题
- 权限拦截导致的跳转首页问题
- 文件流下载被封装工具类解析报错问题
- 效果:现在可以直接在后台下载当日日志,排查问题效率提升 100%。

3. 在线接口调试页面(内置 Postman)
核心价值:免外部工具,直接在后台调试权限接口。
- 核心能力:支持输入接口路径 + JSON 参数、自动携带登录 Token、实时返回响应结果
- 解决的关键坑:请求头丢失导致的 401 权限拦截问题
- 效果:不用再依赖本地 Postman,任何环境下都能快速验证后台接口。

四、解决的关键工程化坑点
- 多模块项目日志路径不匹配:不同模块日志生成路径不统一,导致下载接口找不到文件;
- 日志下载被权限重定向拦截:文件流下载请求被登录拦截器重定向到首页,下载失败;
- 文件流下载被工具类解析报错:封装的响应工具类会自动格式化文件流,导致日志文件损坏;
- 接口调试请求头丢失:调试请求未自动携带登录 Token,直接返回 401 无权限;
- 前端列表渲染问题:日志列表、状态卡片的前端渲染适配问题。
五、后续优化方向(不急,按需迭代)
- 日志页面:支持多服务日志切换(网关、业务服务、AI 服务)、按日期筛选
- 健康检查:接入更全面的监控指标(连接数、延迟、磁盘占用),增加告警逻辑
- 接口调试:支持保存历史请求、JSON 参数格式化、响应结果高亮
- 体验优化:统一运维模块样式、增加加载状态、错误提示
六、一句话总结
今天这三个运维页面,不是 "锦上添花",而是让项目从 "Demo 级" 升级为 "可交付级" 的关键一步。
它们和监控中心不是重复造轮子,而是互补关系:
- 监控中心是给机器看的 "自动化告警";
- 这三个页面是给人用的 "快速排障入口"。
现在,商助慧 Admin 后台已经具备了完整的日常开发、联调、排障能力,后续的迭代和交付,都会比之前轻松很多。
📚 系列导航:
【技术底稿】01:37岁老码农,用4台机器搭了套个人DevOps平台
【产品底稿01】37 岁 Java 老码农,用 Java 搭了个 AI 写作助手,把自己 14 年技术文章全喂给了 AI!