💥昨天掘金 Web 端突然登不上了,一次网络异常的排查记录

故事背景

昨天上午,我像往常一样打开电脑,准备刷会掘金,结果网页一直卡在登录界面,疯狂转圈圈就是不加载

我还以为是我自己电脑网络出了问题,但上百度、知乎啥的都没问题。

用手机一打开掘金,秒进!问了下同事,他们也都能正常登录。

一开始还以为是 DNS 出了点幺蛾子,我立刻祭出经典网络排障大招:

bash 复制代码
ipconfig /flushdns

刷新 DNS 配置后重启浏览器,一点用都没有,还是转圈转圈转圈...

🤔 是不是掘金在精准打击我?

我开始怀疑是不是掘金搞了什么 AB 测试,或者我成了某种「灰度用户」?

于是我在手机端打开掘金,发了个沸点,问问是不是有人也遇到这个问题。

结果还真有几个网友评论说上不去,但大部分人都没啥问题。

这时候我感觉自己可能是那万分之一被眷顾的倒霉蛋

🔍 开始排查:ping 一下 juejin.cn

等到下午4点钟都还没修复,我等不急了,看看能不能自己修复一下这个问题。先ping一下juejin.cn看看咋回事。

我再让同事帮忙ping一下,他是可以ping通的。我才意识到我们访问的是不同的节点,我ping他的地址也能ping通,我脑海里突然有一个绝妙的想法。

tips: 过一段时间ping掘金都是不同的ip,但是他的ip都能ping通,我的ip都ping不通,估计是某个集群的节点都挂了。

💡 灵机一动:改 hosts 文件!

既然我同事的 IP 能正常访问,那我可以:

  1. 拿到他 ping 通的 IP;
  2. 修改本地 hosts 文件,把 juejin.cn 指向这个 IP。

Windows 下 hosts 文件路径:

makefile 复制代码
C:\Windows\System32\drivers\etc\hosts

我加了一行:

bash 复制代码
x.x.x.222 juejin.cn

保存之后清缓存,重启浏览器,奇迹出现了

✨ 掘金网页终于可以正常访问了!

🔄 继续深挖:负载均衡的问题?

掘金 Web 后端肯定是有用负载均衡的,常见的几种策略有:

  • round-robin:轮询分发
  • ip_hash:按 IP 分发
  • weight:加权分发

我和同事的公网 IP 是一样的,那就不应该被分到不同节点。

我开始怀疑是不是用了 源端口 来参与 Hash 了。

查了下资料,像 LVS 或某些 Nginx 配置,确实可能用五元组(源 IP、目标 IP、源端口、目标端口、协议) 来决定访问哪个节点。但是每次访问HTTP请求,端口应该都是会变的,所以也不应该是端口的问题。最后怀疑大概率是用的MAC地址做HASH,因为MAC地址是不变的,所以我试了很多次都登录不了

🧠 小结:可能是某个网关节点挂了

综合判断,很可能是:

  • 掘金某个后端节点挂了;
  • 但 DNS 解析或者负载策略还会把小部分用户分发到这个挂掉的节点;
  • 所以只有"极少部分人"打不开掘金;
  • 修改 hosts 指向健康 IP 是临时绕过方法。

📢 想对掘金说几句话

如果掘金的朋友看到这篇文章:

👉 你们后端某个节点可能挂了,可以检查下是不是健康检查没生效;

👉 顺便问问,要不要给我来个内推?我都给你们排完错了😂


📌 最后

这次经历虽然只是一次小问题,但也提醒了我们:

  • 平常多学一点网络知识真的能救命;
  • 多一些动手排查的勇气;
  • 最后别忘了写成文章分享出来,也许就能帮到别人啦。

如果你也遇到类似情况,欢迎评论区一起交流!

相关推荐
程序员爱钓鱼4 分钟前
Node.js 编程实战:测试与调试 - 单元测试与集成测试
前端·后端·node.js
洛小豆16 分钟前
她问我:服务器快被垃圾文件塞爆了,怎么破?我说:给文件办个“临时居住证”
后端·面试
洛小豆19 分钟前
孤儿资源治理:如何优雅处理“上传了但未提交”的冗余文件?
java·后端·面试
yangminlei21 分钟前
Spring Boot+EasyExcel 实战:大数据量 Excel 导出(高效无 OOM)
spring boot·后端·excel
源代码•宸34 分钟前
Leetcode—1339. 分裂二叉树的最大乘积【中等】
开发语言·后端·算法·leetcode·golang·dfs
码农水水40 分钟前
美团Java后端Java面试被问:Kafka的零拷贝技术和PageCache优化
java·开发语言·后端·缓存·面试·kafka·状态模式
计算机毕设指导61 小时前
基于微信小程序的考研资源共享系统【源码文末联系】
java·spring boot·后端·考研·微信小程序·小程序·maven
superman超哥1 小时前
Rust 结构体中的生命周期参数:所有权设计的核心抉择
开发语言·后端·rust·rust结构体·rust生命周期·所有权设计
沉默-_-1 小时前
从小程序前端到Spring后端:新手上路必须理清的核心概念图
java·前端·后端·spring·微信小程序