软件系统运维常见问题

系统部署常见问题

  1. 环境配置、兼容性问题。生产与测试环境的操作系统、库版本、中间件版本不一致,运行环境软件版本不匹配。新旧版本代码/依赖不兼容。
  2. 依赖缺失或冲突问题。后端包启动失败,提示类/方法/第三方依赖库找不到或者版本冲突。
  3. 配置错误。系统启动后,功能异常,数据库连接失败,权限不足。
  4. 数据库相关表结构升级失败。
  5. 性能问题。系统响应变慢、资源(CPU、内存)占用过高。
  6. 部署失败或回滚困难。部署后新版本系统不可用,无法快速回滚到旧版本。

系统升级后客户端缓存问题的无感知解决方案

1.缓存资源版本化。

2.设置缓存过期时间,确保升级后旧缓存快速过期。

3.缓存隔离,为新旧版本分配不同的缓存空间名,避免缓存污染。

排查系统后台报错

  1. 查看日志文件。查找ERROR、WARNING、Expection、Caused by 等关键字。
  2. 检查启动命令和参数是否正确。JVM 参数:检查 -Xms(初始内存)、-Xmx(最大内存)是否合理。
  3. 检查依赖和配置文件。
  4. 检查端口和资源权限是否正常。

系统加载过慢排查与优化

1.确认问题范围。(影响单个or所有用户?某个页面or整个系统?)

2.前端性能排查。(浏览器开发者模式抓包看网络、性能是否有异常)

3.后端服务排查。(服务器响应时间、查看应用模块的日志)

4.数据库排查。(sql过慢、explian分析执行计划、连接池配置是否合理)

5.服务器资源。(CPU、内存、磁盘是否负载,检查是否有异常进程占用资源)

相关推荐
缘华工业智维32 分钟前
CNN 在故障诊断中的应用:原理、案例与优势
大数据·运维·cnn
华强笔记3 小时前
Linux内存管理系统性总结
linux·运维·网络
拾心214 小时前
【运维进阶】Ansible 角色管理
运维·ansible
phoenix09814 小时前
ansible部署lnmp-allinone
linux·运维·ansible
phoenix09816 小时前
Linux入门DAY27
linux·运维·服务器
xw57 小时前
免费的个人网站托管-PinMe篇
服务器·前端
egoist20238 小时前
【Linux仓库】进程创建与进程终止【进程·柒】
linux·运维·服务器·进程创建·写时拷贝·进程终止
大锦终8 小时前
【Linux】文件系统
linux·服务器·c++
Kyln.Wu9 小时前
【python实用小脚本-190】Python一键删除PDF任意页:输入页码秒出干净文件——再也不用在线裁剪排队
服务器·python·pdf