记一次DNS故障导致用户无法充值的问题(上)

背景:

刚刚过去了五一劳动节,回来后一上班接到客服运营团队反馈的节日期间的问题,反馈有部分用户无法充值。拿到的反馈资料有:

无法充值操作视频、问题时间、手机机型、手机网络情况。

1、从视频中看到用户点击支付后没有任何反应,就像没有进行前后端通信一样

2、排查后端服务器日志,没有访问支付业务的任何accesslog

3、不是所有的用户都无法进行充值

4、用户网络有wifi、有4G

和相关小伙伴讨论无果,QA部门也无法复现用户问题。

分析:

忽然想到10年前在上一家公司时,出现过用户的客户端无法进行更新问题,现象和这个很像。同样是部分用户无法更新。

让运维团队排查DNS的解析,由于没有使用流量分析服务,发现没有DNS的日志。

了解到我司使用的DNS版本【免费版】。

查看阿里云的DNS不同版本的说明,恍然大悟,起码到【个人版】才能保证DNS100%的可用性

确诊:

通过拨测平台发现来自湖北省多个地区有解析异常情况结果为【127.0.0.1】【空白】。对比用户活跃地区IP地址查询,出问题的用户归属地都来自湖北省。

到此问题基本定位为DNS解析问题,接下来如何解决用户问题?且听下回分解。

相关推荐
帅得不敢出门1 小时前
Linux服务器编译android报no space left on device导致失败的定位解决
android·linux·服务器
ajassi20001 小时前
开源 Linux 服务器与中间件(十一)Emqx服务器消息的订阅和发送(mqtt测试)
linux·服务器·开源
平生不喜凡桃李2 小时前
Linux网络层:IP
linux·运维·tcp/ip
塔能物联运维2 小时前
物联网设备运维中的自动化合规性检查与策略执行机制
java·运维·物联网·struts·自动化
阿方索2 小时前
虚拟化技术实践指南:KVM 与 VMware ESXi 部署全流程
linux·运维·服务器
PellyKoo2 小时前
Docker容器中中文文件名显示乱码问题完美解决方案
运维·docker·容器
野犬寒鸦3 小时前
从零起步学习MySQL || 第八章:索引深入理解及高级运用(结合常见优化问题讲解)
java·服务器·数据库·后端·mysql
有谁看见我的剑了?3 小时前
Rocky 9 单机安装elastic-9.1.5
运维·elk
Gss7773 小时前
ELK 日志管理系统相关内容总结
运维·elk
半梦半醒*3 小时前
ELK1——elasticsearch
linux·运维·数据仓库·elasticsearch·centos