线上主系统服务器突然挂了,怎么办?

1.背景

最近在下班回家的路上,运维打电话突然说,线上主系统服务器挂了,怎么办?

2.心态很重要

此时不管是开车还是乘坐公共交通,都需要停下来,找一个安静的环境来处理。

切勿慌张,不要着急忙慌,避免引起个人安全问题。

3.解决思路

  1. 先询问服务器挂掉的原因,了解原因了才能快速思考应对方案
  2. 再询问短期内是否能够恢复,如果10分终内能恢复等一等,如果不能恢复,启动应急预案
  3. 是否有冷备系统注意:必须是可以使用的冷备,特别是检查冷备系统的版本及数据库连接配置是否与主系统一致
  4. 如果没有冷备,是否能够快速部署一套
  5. 是否可以不依赖系统,使用指令或者第三方软件完成系统运维操作
  6. 如果以上都没有,系统今天运维是否已经完成,明天早上部署是否来得及
  7. 如果还不行,回公司人工解决
相关推荐
Avan_菜菜1 小时前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
用户128526116025 小时前
我把祖传Java项目重构后,接口响应从3s砍到了200ms,只改了这几行代码
java
Linsk5 小时前
组件 = 模板 + 业务逻辑
java·前端·vue.js
星沉远浦6 小时前
用Gemini高效解决Java代码报错难以定位的问题
java
用户2986985301410 小时前
Word 文档字符级格式化:Java 实现方案详解
java·后端
笨鸟飞不快10 小时前
从单个服务到集群:一次完整的性能排查复盘
java·前端
荣码10 小时前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
SamDeepThinking11 小时前
Java微服务练习方式
java·后端·微服务
朦胧之21 小时前
AI 编程-老项目改造篇
java·前端·后端
SelectDB1 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维