软件系统运维常见问题

系统部署常见问题

  1. 环境配置、兼容性问题。生产与测试环境的操作系统、库版本、中间件版本不一致,运行环境软件版本不匹配。新旧版本代码/依赖不兼容。
  2. 依赖缺失或冲突问题。后端包启动失败,提示类/方法/第三方依赖库找不到或者版本冲突。
  3. 配置错误。系统启动后,功能异常,数据库连接失败,权限不足。
  4. 数据库相关表结构升级失败。
  5. 性能问题。系统响应变慢、资源(CPU、内存)占用过高。
  6. 部署失败或回滚困难。部署后新版本系统不可用,无法快速回滚到旧版本。

系统升级后客户端缓存问题的无感知解决方案

1.缓存资源版本化。

2.设置缓存过期时间,确保升级后旧缓存快速过期。

3.缓存隔离,为新旧版本分配不同的缓存空间名,避免缓存污染。

排查系统后台报错

  1. 查看日志文件。查找ERROR、WARNING、Expection、Caused by 等关键字。
  2. 检查启动命令和参数是否正确。JVM 参数:检查 -Xms(初始内存)、-Xmx(最大内存)是否合理。
  3. 检查依赖和配置文件。
  4. 检查端口和资源权限是否正常。

系统加载过慢排查与优化

1.确认问题范围。(影响单个or所有用户?某个页面or整个系统?)

2.前端性能排查。(浏览器开发者模式抓包看网络、性能是否有异常)

3.后端服务排查。(服务器响应时间、查看应用模块的日志)

4.数据库排查。(sql过慢、explian分析执行计划、连接池配置是否合理)

5.服务器资源。(CPU、内存、磁盘是否负载,检查是否有异常进程占用资源)

相关推荐
OliverH-yishuihan3 分钟前
用windows10的linux子系统在visual studio2019中用C语言开发linux项目
linux·运维·visual studio
翻斗花园岭第一爆破手6 分钟前
flutter2:Container的简介与尺寸
java·服务器·前端
TG:@yunlaoda360 云老大8 分钟前
华为云国际站代理商GES的应用场景有哪些?
服务器·数据库·华为云
随风语9 分钟前
ansible
运维·自动化·ansible
脏脏a9 分钟前
【Linux】进程地址空间
linux·运维·服务器·进程地址空间
无泪无花月隐星沉9 分钟前
uos server 1070e部署Hadoop
大数据·运维·服务器·hadoop·分布式·uos·国产化os
tianyuanwo11 分钟前
纵深防御:构建安全高效的 Ansible 自动化运维体系
运维·安全·ansible
阎*水12 分钟前
docker教案
linux·运维
走向IT12 分钟前
Python批量修改linux 密码脚本
linux·运维·服务器·python·批量·修改密码
咕噜签名-铁蛋15 分钟前
自建云服务器的潜在风险与安全挑战分析
服务器