京东Taro Native框架静态布局直渲提速

技术背景

Taro Native是京东自研的跨平台移动应用开发框架,支持鸿蒙、iOS、Android三端应用开发,实现一次开发、多端部署。 随着秒送业务功能持续扩展,在华为鸿蒙低端机型上出现严重滑动卡顿,影响用户体验。该页面单张卡片包含100+个元素(图片、文本、容器等),渲染耗时显著,其他端亦存在体验下降。本次优化重点针对鸿蒙端,通过性能分析与调优提升用户体验。

性能分析

页面构成

      • 外层容器:WaterFlow 实现瀑布流列表
      • 单元项:每个 FlowItem 承载一张商家卡片
      • 卡片构建:TML 模板 → CAPI 创建 Node Tree → 挂载至 ArkTS 侧 NodeContent

卡片渲染流程

    1. 页面滑动时,WaterFlow预加载H:Preload FlowItem,调用Repeat.GetFrameChildByIndex获取可复用组件并更新数据,投递解析任务到element线程。
    2. element线程对TML业务代码进行解析并生成Virtual Dom、CSS Info、yoga渲染树,投递测量布局任务到render线程。
    3. render线程基于yoga布局引擎对渲染树进行测量布局,同时生成节点创建、属性设置等命令,投递命令集合到主线程。
    4. 主线程分析命令,调用CAPI接口创建节点、设置属性、更新布局,并将根节点挂载到ArkUI的ContentNode。
    5. 主线程OnVsync时触发Node Tree的系统测量、布局后,发送给render_service渲染上屏。

从上面流程中可以观察到,滑动卡顿的根源在于 主线程过载 ,应聚焦阶段 1、4、5 进行深入优化。

瓶颈定位

阶段1:FlowItem预加载耗时24ms,各区分别耗时A 15ms、B 3ms、C 6ms

A区 Repeat组件从复用池获取可复用组件更新数据,导致组件内部状态变更并触发依赖变更。

B区 图片组件创建图片并加载图片内容。

C区 卡片内所有节点进行测量布局。

阶段4:命令消费主要集中在Image / Text节点的创建和属性设置

阶段5:卡片节点中存在大量Stack / Image / Text节点,递归测量布局开销巨大

核心问题归纳:

1.冗余测量布局:FlowItem 预加载时已进行一次旧内容测量render 线程完成 yoga 测量后,系统在 OnVSync 再次全量测量。

2.Repeat复用:复用链路分散在多阶段,单次耗时虽不长,但累积效应明显需结合鸿蒙系统源码进一步拆解。

方案一:节点树静态布局&拦截系统测量布局

设计思路

利用 render 线程已完成的 yoga 测量结果,直接作为最终布局依据,跳过主线程 OnVSync 阶段的重复测量。

关键技术点

      • CustomNode 自定义 OnMeasure / OnLayout,拦截系统对 CAPI Node Tree 的递归测量
      • 使用 NODE_LAYOUT_RECT 一次性设置四边位置与尺寸

实施步骤

1. 替换布局属性设置方式

设置Node Tree所有节点top、left、width、height时,由NODE_WIDTH、NODE_HEIGHT、NODE_POSITION改成NODE_LAYOUT_RECT

ini 复制代码
ArkUI_NumberValue number[] = {0.0, 0.0,0.0, 0.0};
ArkUI_AttributeItem item = {number, 4};
number[0].i32 = (int32_t)std::floor(vp2PX(left));
number[1].i32 = (int32_t)std::floor(vp2PX(top));
number[2].i32 = (int32_t)std::floor(vp2PX(width));
number[3].i32 = (int32_t)std::floor(vp2PX(height));
ArkUI_NativeNodeAPI_1::Instance().setAttribute(nodeHandle, NODE_LAYOUT_RECT, &item);

2. 根节点升级为 CustomNode 并注册拦截

CAPI创建Node Tree的根节点StackNode替换成CustomNode,注册自定义测量布局函数,拦截系统对NodeTree的递归测量布局

css 复制代码
// 注册自定义事件监听接口
void CustomNode::EnableLayoutInterception() {
    ArkUI_NativeNodeAPI_1::Instance().addNodeCustomEventReceiver(nodeHandle, OnStaticCustomEvent);
    ArkUI_NativeNodeAPI_1::Instance().registerNodeCustomEvent(nodeHandle, ARKUI_NODE_CUSTOM_EVENT_ON_MEASURE, 0, this);
    ArkUI_NativeNodeAPI_1::Instance().registerNodeCustomEvent(nodeHandle, ARKUI_NODE_CUSTOM_EVENT_ON_LAYOUT, 0, this);
}

// 移除自定义事件监听接口
void CustomNode::DisableLayoutInterception() {
    ArkUI_NativeNodeAPI_1::Instance().removeNodeCustomEventReceiver(nodeHandle, OnStaticCustomEvent);
    ArkUI_NativeNodeAPI_1::Instance().unregisterNodeCustomEvent(nodeHandle, ARKUI_NODE_CUSTOM_EVENT_ON_MEASURE);
    ArkUI_NativeNodeAPI_1::Instance().unregisterNodeCustomEvent(nodeHandle, ARKUI_NODE_CUSTOM_EVENT_ON_LAYOUT);
}

// 系统测量布局事件处理
void CustomNode::OnStaticCustomEvent(ArkUI_NodeCustomEvent *event) {
    auto customNode = (CustomNode *) OH_ArkUI_NodeCustomEvent_GetUserData(event);
    auto type = OH_ArkUI_NodeCustomEvent_GetEventType(event);
    switch (type) {
        case ARKUI_NODE_CUSTOM_EVENT_ON_MEASURE:
            customNode->OnMeasure(event);
            break;
        case ARKUI_NODE_CUSTOM_EVENT_ON_LAYOUT:
            customNode->OnLayout(event);
            break;
        default:
            break;
    }
}

// 自定义测量
void CustomNode::OnMeasure(ArkUI_NodeCustomEvent *event) {
    const ArkUI_AttributeItem *item = ArkUI_NativeNodeAPI_1::Instance().getAttribute(nodeHandle, NODE_LAYOUT_RECT);
    ArkUI_NativeNodeAPI_1::Instance().setMeasuredSize(nodeHandle, item->value[2].i32, item->value[3].i32);
}

// 自定义布局
void CustomNode::OnLayout(ArkUI_NodeCustomEvent *event) { }

优化机制:CustomNode自定义测量布局函数,拦截了系统对CAPI创建NodeTree的递归测量布局;设置节点的NODE_LAYOUT_RECT可以直接用于后续的绘制渲染。

边界场景与应对

优化效果

  • 预加载阶段 C 区(文本测量布局)显著缩短
  • 鸿蒙低端机平均帧率 :43 fps → 57 fps ,提升 ≈32.5%

方案二:复用字体测量布局缓存

原文本测量布局瓶颈分析

经过方案一优化后,系统仍会在主线程执行文本测量布局。我们梳理了文本节点的创建与属性设置流程,发现文本测量依赖于 ArkGraphics 2D 自研文本引擎〔1〕,用于处理复杂文本显示场景。该测量过程目前分布在两个阶段:

优化策略:文本测量前置化与结果缓存

将文本测量完全前移至 render 线程 ,并在该阶段缓存 ArkUI_StyledString 结果;主线程仅消费缓存值,不再重复测量。

实施步骤

1. Render 线程测量并缓存 StyledString

scss 复制代码
TextStyledString measureTextWithStyledString1(MeasureInfo measureInfo) {
    // 1.创建 TextStyle:设置FontSize、FontHeight、FontWeight、Overflow、FontFamilies、FontStyle、Color、Decoration
    OH_Drawing_TextStyle* textStyle = OH_Drawing_CreateTextStyle();
    
    // 2.创建 TypographyStyle:设置MaxLines、ellipsis overflow、TEXT_ALIGN
    OH_Drawing_TypographyStyle* typographyStyle = OH_Drawing_CreateTypographyStyle();
    
    // 创建 StyledString
    OH_Drawing_FontCollection* fontCollection = GetFontCollection();
    ArkUI_StyledString* styledString = OH_ArkUI_StyledString_Create(typographyStyle, fontCollection);
    
    // 添加文本
    OH_ArkUI_StyledString_PushTextStyle(styledString, textStyle);
    OH_ArkUI_StyledString_AddText(styledString, measureInfo.text.c_str());
    OH_ArkUI_StyledString_PopTextStyle(styledString);
    
    // TextStyle 在添加文本后不再需要,直接销毁
    OH_Drawing_DestroyTextStyle(textStyle);
    
    // 创建 Typography 并布局
    OH_Drawing_Typography* typography = OH_ArkUI_StyledString_CreateTypography(styledString);
    OH_Drawing_TypographyLayout(typography, vp2Px(measureInfo.maxWidth));
    
    // 获取测量结果
    size_t lineCount = OH_Drawing_TypographyGetLineCount(typography);
    double height = px2Vp(OH_Drawing_TypographyGetHeight(typography));
    double width = px2Vp(ceil(OH_Drawing_TypographyGetLongestLine(typography)));
    
    // 返回字体styledString
    return TextStyledString(typographyStyle, typography, styledString);
}

2. 主线程直接应用缓存

css 复制代码
if (cachedStyledString_.IsValid()) {
    ArkUI_NativeNodeAPI_1::Instance().resetAttribute(nodeHandle, NODE_TEXT_CONTENT_WITH_STYLED_STRING);
    ArkUI_AttributeItem content = { .object = static_cast<void*>(cachedStyledString_.GetStyledString()) };
    ArkUI_NativeNodeAPI_1::Instance().setAttribute(nodeHandle, NODE_TEXT_CONTENT_WITH_STYLED_STRING, &content);
}

收益评估

  • 主线程耗时降低 :≈ 4 ms+
  • 线程负载均衡:减轻主线程压力,提升帧稳定性
  • 一致性保障:同一文本仅测量一次,避免多线程结果差异

总结与沉淀

方法论沉淀

本次实践形成了一套适用于 类 RN 架构 的通用提速范式------ 《类 RN 静态布局直渲提速》

    1. 前置测量:在 render 线程完成布局计算
    2. 结果直通 :通过 NODE_LAYOUT_RECT 将尺寸与位置一次性注入节点
    3. 拦截去重:借助 CustomNode 拦截系统重复测量
    4. 资源复用:对文本等资源建立跨线程缓存

该方法可横向迁移至其他产品的同构框架,显著提升低端设备渲染性能。

致谢

特别感谢 华为 2012 鸿蒙突击队 在本次问题联合攻关中的深度支持与协同分析。

相关推荐
程序员小羊!1 小时前
03JavaScript预备知识
前端
前端的阶梯1 小时前
Cursor 开发 Python 项目完全指南
前端·人工智能·后端
艾伦野鸽ggg1 小时前
JavaScript 基础语法速通
前端·javascript
不懂的浪漫1 小时前
AI 时代还需要买课吗?我用 Skills + Markdown + HTML 搭了一套自学系统
前端·人工智能·html·skill
前端的阶梯1 小时前
Conda 开发 Python 程序完全指南
前端·人工智能·后端
zhengfei6111 小时前
第2章 Agent 核心组件深度解析
前端·javascript·react.js
Linsk2 小时前
前端代码压缩对浏览器兼容性的影响
前端
yingyima2 小时前
凌晨3点的闹钟:分布式定时任务设计实战
前端
用户81423861188412 小时前
iOS ObjectC棕地应用集成Expo(React Native)的过程及踩坑
前端