Dokit 卡顿检测的 一个bug

Dokit 卡顿检测原理

原理非常简单,主要还是利用 Printer 这个接口

判断 两次println 的执行间隔时间 ,来判断是否发生了卡顿

这个检测的方案很简单, 但是光检测没用呀,还必须要检测出哪里卡了,所以必须要 获取主线程的堆栈,

获取主线程堆栈 必须要注意2点:

  1. 获取堆栈的操作 一定要放到子线程去做, 主线程操作堆栈 容易卡
  2. 即使放到子线程去操作,也要注意控制采集频率

对于dokit来说 Printer的实现类是 MonitorCore

采集堆栈的实现类是 StackSampler

先看MonitorCore

这里其实非常简单,就是判断一下 两次println的时间间隔,发现卡顿

然后去sampler里面取堆栈

看下StackSampler 是如何 获取在子线程获取主线程堆栈的?

首先肯定是有一个子线程的

我们每次都是往这个子线程中去push一个消息,然后执行我们的runnable

这个里面其实就是有dumpinfo的方法了

这里要注意 堆栈是存储在一个map里面的,key是 获取堆栈的时间,value就是堆栈的字符串

整体上逻辑就是这样

Dokit的 缺陷

再看下 MonitorCore

这里会发生一个情况,每次有消息到来时,会启动start 然后再启动stop ,为啥?

因为你要保证大部分情况下,没有卡顿时 就不要采集堆栈,

所以大部分情况下 采集堆栈的 runnable 是没有机会执行的。

bug 就出现在这里

堆栈采集的默认延迟 是300ms

而我们的卡顿阈值是200ms

那这里就会有一个问题了, 假设一个卡顿是250ms

那么肯定会触发 卡顿的检测,isBlock方法 会返回true。

但是你获取堆栈 会发现获取不到的。为什么?

因为此时 dump所在的runnable 还没开始执行呢,他要300ms以后才执行, 250ms你消息过来了,直接触发了 stopDump

所以大家在使用dokit的时候 还是尽量修改一下这2个默认值

至少要保证 block的值 一定要大于 堆栈采集的延迟阈值, 否则就会出现上述bug

另外采集堆栈这个操作 如果要放到线上,推荐还是把优先级调到最低,这样对业务影响最小

相关推荐
龚礼鹏3 小时前
图像显示框架八——BufferQueue与BLASTBufferQueue(基于android 15源码分析)
android·c语言
1登峰造极3 小时前
uniapp 运行安卓报错reportJSException >>>> exception function:createInstanceContext, exception:white screen
android·java·uni-app
木易 士心3 小时前
Android Handler 机制原理详解
android
kkk_皮蛋4 小时前
作为一个学生,如何用免费 AI 工具手搓了一款 Android AI 日记 App
android·人工智能
金山毒霸电脑医生4 小时前
植物大战僵尸杂交版最新v0.2版下载安装|2025图文解析教程
android·游戏·ios·植物大战僵尸·软件下载安装
羑悻的小杀马特4 小时前
Docker-Android 容器化 + cpolar 穿透,完善异地调试
android·运维·docker·容器·cpolar
恋猫de小郭4 小时前
Android Gradle Plugin 9.0 发布,为什么这会是个史诗级大坑版本
android·flutter·ios·开源
Calebbbbb5 小时前
Ubuntu 24.04 + Android 15 (AOSP) 环境搭建与源码同步完整指南
android·linux·ubuntu
小小码农Come on6 小时前
QT中窗口位置、相对位置、绝对位置
android·开发语言·qt
b2077218 小时前
Flutter for OpenHarmony 身体健康状况记录App实战 - 个人中心实现
android·java·python·flutter·harmonyos