记一次DNS故障导致用户无法充值的问题(上)

背景:

刚刚过去了五一劳动节,回来后一上班接到客服运营团队反馈的节日期间的问题,反馈有部分用户无法充值。拿到的反馈资料有:

无法充值操作视频、问题时间、手机机型、手机网络情况。

1、从视频中看到用户点击支付后没有任何反应,就像没有进行前后端通信一样

2、排查后端服务器日志,没有访问支付业务的任何accesslog

3、不是所有的用户都无法进行充值

4、用户网络有wifi、有4G

和相关小伙伴讨论无果,QA部门也无法复现用户问题。

分析:

忽然想到10年前在上一家公司时,出现过用户的客户端无法进行更新问题,现象和这个很像。同样是部分用户无法更新。

让运维团队排查DNS的解析,由于没有使用流量分析服务,发现没有DNS的日志。

了解到我司使用的DNS版本【免费版】。

查看阿里云的DNS不同版本的说明,恍然大悟,起码到【个人版】才能保证DNS100%的可用性

确诊:

通过拨测平台发现来自湖北省多个地区有解析异常情况结果为【127.0.0.1】【空白】。对比用户活跃地区IP地址查询,出问题的用户归属地都来自湖北省。

到此问题基本定位为DNS解析问题,接下来如何解决用户问题?且听下回分解。

相关推荐
Fcy64820 分钟前
Linux下 进程(一)(冯诺依曼体系、操作系统、进程基本概念与基本操作)
linux·运维·服务器·进程
袁袁袁袁满22 分钟前
Linux怎么查看最新下载的文件
linux·运维·服务器
代码游侠42 分钟前
学习笔记——设备树基础
linux·运维·开发语言·单片机·算法
主机哥哥1 小时前
阿里云OpenClaw部署全攻略,五种方案助你快速部署!
服务器·阿里云·负载均衡
Harvey9031 小时前
通过 Helm 部署 Nginx 应用的完整标准化步骤
linux·运维·nginx·k8s
珠海西格电力科技2 小时前
微电网能量平衡理论的实现条件在不同场景下有哪些差异?
运维·服务器·网络·人工智能·云计算·智慧城市
释怀不想释怀2 小时前
Linux环境变量
linux·运维·服务器
zzzsde2 小时前
【Linux】进程(4):进程优先级&&调度队列
linux·运维·服务器
qq_297574673 小时前
Linux 服务器 Java 开发环境搭建保姆级教程
java·linux·服务器
聆风吟º4 小时前
CANN开源项目实战指南:使用oam-tools构建自动化故障诊断与运维可观测性体系
运维·开源·自动化·cann