记一次DNS故障导致用户无法充值的问题(上)

背景:

刚刚过去了五一劳动节,回来后一上班接到客服运营团队反馈的节日期间的问题,反馈有部分用户无法充值。拿到的反馈资料有:

无法充值操作视频、问题时间、手机机型、手机网络情况。

1、从视频中看到用户点击支付后没有任何反应,就像没有进行前后端通信一样

2、排查后端服务器日志,没有访问支付业务的任何accesslog

3、不是所有的用户都无法进行充值

4、用户网络有wifi、有4G

和相关小伙伴讨论无果,QA部门也无法复现用户问题。

分析:

忽然想到10年前在上一家公司时,出现过用户的客户端无法进行更新问题,现象和这个很像。同样是部分用户无法更新。

让运维团队排查DNS的解析,由于没有使用流量分析服务,发现没有DNS的日志。

了解到我司使用的DNS版本【免费版】。

查看阿里云的DNS不同版本的说明,恍然大悟,起码到【个人版】才能保证DNS100%的可用性

确诊:

通过拨测平台发现来自湖北省多个地区有解析异常情况结果为【127.0.0.1】【空白】。对比用户活跃地区IP地址查询,出问题的用户归属地都来自湖北省。

到此问题基本定位为DNS解析问题,接下来如何解决用户问题?且听下回分解。

相关推荐
HalvmånEver3 小时前
Linux:命名管道实现IPC(进程间通信七)
linux·运维·服务器·ipc·命名管道·管道pipe
正在学习前端的---小方同学8 小时前
Harbor部署教程
linux·运维
牛奔9 小时前
Docker Compose 两种安装与使用方式详解(适用于 Docker 19.03 版本)
运维·docker·云原生·容器·eureka
翼龙云_cloud9 小时前
阿里云渠道商:如何手动一键扩缩容ECS实例?
运维·服务器·阿里云·云计算
墨风如雪10 小时前
拒绝被找回!MJJ必修课:Outlook邮箱交易后的“防回手”安全设置全攻略
服务器
DX_水位流量监测11 小时前
大坝安全监测之渗流渗压位移监测设备技术解析
大数据·运维·服务器·网络·人工智能·安全
电商API&Tina11 小时前
京东 API 数据采集接口接入与行业分析
运维·服务器·网络·数据库·django·php
Mr_Xuhhh11 小时前
博客标题:深入理解Shell:从进程控制到自主实现一个微型Shell
linux·运维·服务器
f***241114 小时前
高效自动化管理临时文件的技术方案
运维·自动化
m0_7381207215 小时前
应急响应——知攻善防靶场Linux-1详细应急过程
linux·运维·服务器·网络·web安全·ssh