5 月 20 日,Google 发布 Android Performance Analyzer open beta。它面向 Android App 和游戏性能分析,第一阶段开放的是新的 System Profiler,能看 CPU、GPU、内存、功耗,以及应用和系统行为之间的关系。
这次更新更偏底层性能工程。做普通业务 App 的人会用到启动、卡顿、功耗分析;做游戏或重图形应用的人,会更关心 Vulkan、GPU Counter、SurfaceFlinger、Frame timing 和自定义 Perfetto SQL。

新的 System Profiler
APA 建在现有性能体系之上。它底层依赖 Perfetto 做系统 Trace,后续帧分析和图形调试能力会基于 LunarG 的 GFXReconstruct。Android 12 及以上设备在系统级性能采集、GPU Counter 和渲染阶段数据上体验最好。
这几个关键词放在一起,说明 APA 想处理的不是单点指标。它要把 CPU 调度、线程活动、GPU 计数器、SurfaceFlinger、功耗和帧时间放到同一个分析工作区里。以前性能问题经常散在几个工具之间,Trace 看一份,GPU 数据看一份,截图和帧时间再对一遍,排查成本很高。

新的 System Profiler 可以在采集时选择 GPU Counter 和其他数据,也支持自定义 Perfetto 配置。采集方式也不只限于应用启动时立刻开始,能在启动时采集,也能手动触发。对游戏和复杂业务来说,这一点很实际,因为问题经常出现在进入某个页面、切换某个场景、跑到某个副本之后。
两种入口
APA 有两个入口。一个是独立桌面应用,支持 Windows、macOS 和 Linux;另一个集成在 Android Studio 里,作为更新后的 System Trace viewer,要求 Android Studio Panda 4 Canary 及后续版本。
独立桌面版不要求 Android Studio 工程,也不依赖 Gradle 构建。它更适合性能工程师、游戏引擎团队、SDK 团队直接拿 Trace 做分析。Android Studio 入口更适合日常应用开发,改完代码后直接从 IDE 里打开 Trace 看问题。

工作区管理也比单次打开 Trace 更像一个长期排查工具。你可以打开已有 Perfetto Trace,缩放时间线,用 ruler 量事件耗时,给发现做书签和注释,也可以把关键 Track pin 到顶部。性能问题不是看一眼就结束,很多时候要反复对比多次采集结果,这类能力会直接影响排查效率。

图形问题
APA 对图形应用的价值更直接。它提供 Qualcomm、Arm、Imagination、Samsung 等硬件上的 GPU Performance Counter,还能看电池和功耗影响。对重渲染场景来说,CPU 忙不忙、GPU 卡在哪、SurfaceFlinger 合成是否拖慢一帧,这些信息需要放到一起看。
SurfaceFlinger 事件是这里的关键。它能把渲染和显示合成管线暴露出来,从应用提交帧到最终显示,中间每段花了多少时间,都可以跟其他系统活动一起对齐。再配合截图 scrub,开发者能更快定位"这段卡顿到底发生在哪个画面附近"。

Vulkan 开发者还可以利用 Debug Marker 做分段分析。把渲染 pass、资源更新、UI 绘制、后处理这些阶段标出来,再回到 Trace 里看每段成本,问题会比只看总帧耗时清楚很多。

SQL 和 AI
APA 支持用 SQL 查询 Trace,这意味着它不只适合鼠标拖时间线,也适合做可重复分析。比如你想统计某类 Slice 的总耗时、找出最长的帧、对比不同版本里某个 Track 的分布,用 SQL 会比手动找更稳定。
根据 Perfetto 的查询方式,一个最小查询可以长这样:
bash
SELECT
name,
dur / 1000000.0 AS duration_ms
FROM slice
WHERE dur > 16000000
ORDER BY dur DESC
LIMIT 20;
这段 SQL 的意思是找出耗时超过 16ms 的 slice,并按耗时倒序列出。真实项目里还会继续关联 thread、process、frame timeline 或 GPU 相关表,但思路一样:把一次"看图找问题"变成可重复的查询。

APA 还配了 Perfetto SQL skill 和 Perfetto Analysis skill。前者帮 AI Agent 生成自定义 SQL,后者回答更高层的问题,比如"为什么 App 启动慢"。这类能力不能替代性能判断,但能降低起步成本,尤其是团队里不是每个人都熟悉 Perfetto 表结构。
帧和功耗
APA 直接提供 FPS 和 Frame Duration Track,用来把帧率、帧耗时和其他系统活动对齐。卡顿排查最怕只有结果没有上下文,只知道某一秒掉帧,但不知道同一时间 CPU、GPU、IO、SurfaceFlinger 或其他线程发生了什么。

Trace 渲染速度相比 Android GPU Inspector 通常快 6x 到 26x,处理大 Trace 时稳定性也更好。这个点对大型游戏和复杂 App 很关键,因为 Trace 一大,工具本身卡住,排查体验会直接崩掉。
最后
APA open beta 现在已经能用。独立桌面版适合不依赖 Android Studio 工程的深度分析,Android Studio Panda 4 Canary 及后续版本则会把它接进 IDE 的 System Trace viewer。
如果团队已经在用 Perfetto 或 AGI,APA 可以先拿一条真实卡顿 Trace 试。重点不是换工具,而是把采集、对齐、查询、标注和复盘放进同一个工作流里。