记一次DNS故障导致用户无法充值的问题(上)

背景:

刚刚过去了五一劳动节,回来后一上班接到客服运营团队反馈的节日期间的问题,反馈有部分用户无法充值。拿到的反馈资料有:

无法充值操作视频、问题时间、手机机型、手机网络情况。

1、从视频中看到用户点击支付后没有任何反应,就像没有进行前后端通信一样

2、排查后端服务器日志,没有访问支付业务的任何accesslog

3、不是所有的用户都无法进行充值

4、用户网络有wifi、有4G

和相关小伙伴讨论无果,QA部门也无法复现用户问题。

分析:

忽然想到10年前在上一家公司时,出现过用户的客户端无法进行更新问题,现象和这个很像。同样是部分用户无法更新。

让运维团队排查DNS的解析,由于没有使用流量分析服务,发现没有DNS的日志。

了解到我司使用的DNS版本【免费版】。

查看阿里云的DNS不同版本的说明,恍然大悟,起码到【个人版】才能保证DNS100%的可用性

确诊:

通过拨测平台发现来自湖北省多个地区有解析异常情况结果为【127.0.0.1】【空白】。对比用户活跃地区IP地址查询,出问题的用户归属地都来自湖北省。

到此问题基本定位为DNS解析问题,接下来如何解决用户问题?且听下回分解。

相关推荐
__雨夜星辰__30 分钟前
Linux 学习笔记__Day2
linux·服务器·笔记·学习·centos 7
大耳朵土土垚31 分钟前
【Linux】日志设计模式与实现
linux·运维·设计模式
学问小小谢33 分钟前
第26节课:内容安全策略(CSP)—构建安全网页的防御盾
运维·服务器·前端·网络·学习·安全
yaoxin5211232 小时前
第十二章 I 开头的术语
运维·服务器
ProgramHan2 小时前
1992-2025年中国计算机发展状况:服务器、电脑端与移动端的演进
运维·服务器·电脑
马立杰5 小时前
H3CNE-33-BGP
运维·网络·h3cne
云空6 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
没有名字的小羊7 小时前
Cyber Security 101-Build Your Cyber Security Career-Security Principles(安全原则)
运维·网络·安全
m0_465215797 小时前
TCP & UDP Service Model
服务器·网络·tcp/ip
千夜啊7 小时前
Nginx 运维开发高频面试题详解
运维·nginx·运维开发