线上主系统服务器突然挂了,怎么办?

1.背景

最近在下班回家的路上,运维打电话突然说,线上主系统服务器挂了,怎么办?

2.心态很重要

此时不管是开车还是乘坐公共交通,都需要停下来,找一个安静的环境来处理。

切勿慌张,不要着急忙慌,避免引起个人安全问题。

3.解决思路

  1. 先询问服务器挂掉的原因,了解原因了才能快速思考应对方案
  2. 再询问短期内是否能够恢复,如果10分终内能恢复等一等,如果不能恢复,启动应急预案
  3. 是否有冷备系统注意:必须是可以使用的冷备,特别是检查冷备系统的版本及数据库连接配置是否与主系统一致
  4. 如果没有冷备,是否能够快速部署一套
  5. 是否可以不依赖系统,使用指令或者第三方软件完成系统运维操作
  6. 如果以上都没有,系统今天运维是否已经完成,明天早上部署是否来得及
  7. 如果还不行,回公司人工解决
相关推荐
xingyuzhisuan3 分钟前
从零精通GPU服务器模型部署:标准化流程与性能调优实战
运维·服务器·人工智能
做个文艺程序员5 分钟前
第10篇(终篇):生产级 ES 运维——监控、备份、安全与故障排查完全手册
运维·安全·elasticsearch·es备份恢复·es升级·集群故障排查
一起逃去看海吧7 分钟前
对接LangSmith
java·前端·数据库
wyhwust7 分钟前
web应用技术-第一次课后作业
java·前端·数据库
java1234_小锋10 分钟前
什么是 RAG(检索增强生成)?请简述 Spring AI 实现 RAG 的完整流程,包括涉及的核心组件。
java·人工智能·spring·rag
s_w.h11 分钟前
【 linux 】文件管理与重定向
linux·运维·服务器
烟雨江南aabb15 分钟前
Docker第一弹 Docker是什么?
运维·docker·容器
Cloud_Shy61817 分钟前
Linux 系统定时任务 Cron(d) 服务应用实践(二:生产环境下的用户定时任务)
linux·运维·服务器·centos·云计算
Saniffer_SH17 分钟前
【每日一题】不只是点亮画面:UniGraf 如何把 HDMI/DP 接口问题拆成可定位、可复现、可自动化验证的测试流程?
运维·人工智能·测试工具·fpga开发·性能优化·自动化·压力测试
砍材农夫18 分钟前
物联网 基于netty核心实战-心跳保活机制
java·后端·物联网·struts·servlet·netty