【HarmonyOS】GC垃圾回收

目录

GC(Garbage Collection),即垃圾回收。在计算机领域,GC是指识别并释放内存中的不再使用的对象,以回收内存空间。目前广泛使用的编程语言实现的GC算法主要分为两大类:引用计数和对象追踪(即Tracing GC)。

一、GC算法简述

1.GC的类型

(1).引用计数

当对象B指向对象A时,A的引用计数加1;当该指向断开时,A的引用计数减1。如果A的引用计数为0,则回收对象A。

  • 优点:引用计数算法设计简单,而且会在对象成为垃圾时及时回收该部分内存,因此无需引入单独的暂停业务代码(STW)阶段。
  • 缺点:在对象操作时插入了计数环节,增加了内存分配和赋值的开销,影响性能。存在因循环引用而导致的内存泄漏问题。
typescript 复制代码
class Parent {
  constructor() {
    this.child = null;
  }
  child: Child | null = null;
}

class Child {
  constructor() {
    this.parent = null;
  }
  parent: Parent | null = null;
}

function main() {
  let parent: Parent = new Parent();
  let child: Child = new Child();
  parent.child = child;
  child.parent = parent;
}

在上述代码中,对象parent被对象child持有,parent的引用计数加1。同时,child也被parent持有,child的引用计数也会加1。这形成了循环引用,导致直到main函数结束,parent和child都无法释放,从而引发内存泄漏。

(2).对象追踪

根对象包括程序运行中的栈内对象和全局对象等当前时刻一定存活的对象。从根对象开始,通过引用链可以访问到的所有对象(可达对象)也是存活的。通过遍历可以找到所有存活对象。如图所示,从根对象开始遍历,所有可达对象标记为蓝色,即为活对象。剩下的不可达对象标记为黄色,即为垃圾。

  • 优点:对象追踪算法可以解决循环引用问题,并且对内存的分配- 和赋值没有额外开销。
  • 缺点:和引用计数算法相比,对象追踪算法较为复杂,有短暂的STW阶段。而且回收有延迟,会导致较多的浮动垃圾。

引用计数和对象追踪算法各有优劣。由于引用计数存在内存泄漏问题,ArkTS运行时选择基于对象追踪算法设计GC。

2.对象追踪的三种类型

对象追踪算法通过遍历对象标记出垃圾,而根据垃圾回收方式的不同,对象追踪可以分为三种基本类型:标记-清扫回收、标记-复制回收、标记-整理回收。下图中蓝色标记为可达对象,黄色标记为不可达对象。

(1).标记-清扫回收

完成对象图遍历后,删除不可达对象内容,并将其放入空闲队列,以便下次对象分配。

该回收方式不搬移对象,效率高。但回收对象内存地址不连续,导致内存碎片化,降低分配效率。极端情况下,即使有大量空闲内存,也可能无法放入较大对象。

(2).标记-复制回收

遍历对象图时,将可达对象复制到新内存空间。遍历完成后,回收旧内存空间。

这种方式可以解决内存碎片问题,通过一次遍历完成整个GC过程,效率较高。但在极端情况下(From-space 中所有的对象都是存活的),需要预留一半内存空间以确保所有活动对象都可以被拷贝,这会导致空间利用率较低。(因为 From-space 和 To-space 是从总堆内存中划分出来的,并且大小相等,所以:总堆内存 = From-space + To-space 这意味着,总有一半的内存是"闲置"的,用于接收复制过来的对象。)

(3).标记-整理回收

完成对象图遍历后,将可达对象(蓝色)复制到本区域或指定区域的头部空闲位置,然后将已复制的对象回收整理到空闲队列中。

  • 优点:解决了"标记-清扫回收"导致的大量内存碎片问题,避免了"标记-复制回收"浪费一半内存空间。
  • 缺点:和"标记-复制回收"相比,性能开销较高。整个过程需要多次遍历堆内存(计算地址、更新引用、移动对象),尤其是更新所有引用这一步,带来了巨大的时间开销。

3.HPP GC

HPP GC,即高性能部分垃圾回收,其中"High Performance"主要体现在分代模型、混合算法和GC流程优化这三个方面。HPP GC根据不同对象区域采取不同的回收方式。

(1).分代模型

ArkTS运行时采用传统的分代模型,将对象进行分类。大多数新分配的对象会在一次GC后被回收,而大多数经过多次GC后依然存活的对象会继续存活。ArkTS运行时将对象划分为年轻代和老年代对象,并分配到不同空间。

ArkTS运行时将新分配的对象直接分配到年轻代(Young Space)的From空间。经过一次GC后依然存活的对象,会移动到To空间。经过再次GC后依然存活的对象,会被移动到老年代(Old Space)。

(2).混合算法

HPP GC是部分复制、部分整理和部分清扫的混合算法。根据年轻代和老年代对象特点,采取不同的回收方式。

  • 部分复制

    考虑到年轻代对象生命周期短、回收频繁且大小有限,ArkTS运行时对年轻代对象采用"标记-复制回收"算法。

  • 部分整理+部分清扫

    根据老年代对象的特点,引入启发式Collection Set(简称CSet)选择算法。该算法在标记阶段统计每个区域的存活对象大小,然后在回收阶段优先选择存活对象少、回收代价小的区域进行对象整理回收,再对剩余区域进行清扫回收。

回收策略如下:

  • 根据设定的区域存活对象大小阈值,将满足条件的区域纳入初步的CSet队列,并根据存活率进行从低到高的排序(注:存活率=存活对象大小/区域大小)。
  • 根据设定的释放区域个数阈值,选出最终的CSet队列,进行整理回收。
  • 对未被选入CSet队列的区域进行清扫回收。

启发式CSet选择算法结合了"标记-整理回收"和"标记-清扫回收"算法的优点,避免了内存碎片问题,同时提升了性能。

(3).流程优化

HPP GC流程中引入了大量的并发和并行优化,以减少对应用性能的影响。采用了并发+并行标记(Marking)、并发+并行清扫(Sweep)、并行复制/整理(Evacuation)、并行回改(Update)和并发清理(Clear)执行GC任务。

二、Heap结构

1.Heap结构

  • Young Space:年轻代,存放新创建出来的对象,存活率低,主要使用复制算法进行内存回收。
  • OldSpace:老年代,存放年轻代多次回收仍存活的对象会被移动到该空间,根据场景混合多种算法进行内存回收。
  • HugeObjectSpace:大对象空间,使用单独的Region存放一个大对象的空间。
  • ReadOnlySpace:只读空间,存放运行期间的只读数据。
  • NonMovableSpace:不可移动空间,存放不可移动的对象。
  • SnapshotSpace:快照空间,转储堆快照时使用的空间。
  • MachineCodeSpace:机器码空间,存放程序机器码。

每个空间由一个或多个Region进行分区域管理。Region是空间向内存分配器申请的单位。

三、GC流程

1.HPP GC的类型

Young GC

  • 触发机制:年轻代GC触发阈值在2MB-16MB,根据分配速度和存活率变化。
  • 说明:主要回收semi Space(heap中生成两个semi space,供copying使用)新分配的年轻代对象。
  • 场景:前台场景。
  • 日志关键词:[ HPP YoungGC ]

Old GC

  • 触发机制:老年代GC触发阈值在20MB到300MB之间变化。通常,第一次Old GC的阈值约为20MB,之后会根据对象存活率和内存占用情况进行调整。
  • 说明:对年轻代和部分老年代空间做整理压缩,其他空间做sweep清理。触发频率比年轻代GC低很多,由于会做全量mark,因此GC时间会比年轻代GC长,单次耗时约5ms~10ms。
  • 场景:前台场景。
  • 日志关键词:[ HPP OldGC ]

Full GC

  • 触发机制:不会由内存阈值触发。应用切换到后台场景之后,若预测可回收对象大小超过2M,则会触发一次Full GC。DumpHeapSnapshot和AllocationTracker工具默认会触发Full GC。Native接口和ArkTS接口也可触发。
  • 说明:对年轻代和老年代做全量压缩,主要用于性能不敏感场景,最大限度回收内存。
  • 场景:后台场景。
  • 日志关键词:[ CompressGC ]

此后,Smart GC或IDLE GC会从上述三种GC中选择。

2.触发策略

空间阈值触发GC

  • 函数方法:AllocateYoungOrHugeObject,AllocateHugeObject等分配函数。
  • 限制参数:对应的空间阈值。
  • 说明:对象申请空间到达阈值时触发GC。
  • 典型日志:日志可区分GCReason::ALLOCATION_LIMIT。

native绑定大小达到阈值触发GC

  • 函数方法:GlobalNativeSizeLargerThanLimit
  • 限制参数:globalSpaceNativeLimit
  • 说明:影响是否进行全量mark以及是否开启并发mark。

切换后台触发GC

  • 函数方法:ChangeGCParams
  • 说明:切换到后台场景后主动触发一次Full GC。
  • 典型日志:app is inBackground 和 app is not inBackground。
    GC 日志中可区分GCReason::SWITCH_BACKGROUND。

3.执行策略

ConcurrentMark

  • 函数方法:TryTriggerConcurrentMarking
  • 说明:尝试触发并发mark,将遍历对象进行标记的任务交由线程池中并发运行,减少UI主线程挂起时间。
  • 典型日志:fullMarkRequested,trigger full mark,Trigger the first full mark,Trigger full mark,Trigger the first semi mark,Trigger semi mark。

new space GC前后的阈值调整

  • 函数方法:AdjustCapacity
  • 说明:GC后,调整SemiSpace的触发水线,优化空间结构。
  • 典型日志:无直接日志。可以通过GC统计日志看出,GC前Young space的阈值有动态调整。

第一次OldGC后阈值的调整

  • 函数方法:AdjustOldSpaceLimit
  • 说明:根据最小增长步长以及平均存活率调整OldSpace阈值限制。
  • 日志关键词:AdjustOldSpaceLimit

第二次及以后的OldGC对old Space和global space阈值调整,以及增长因子的调整

  • 函数方法:RecomputeLimits
  • 说明:根据当前 GC 统计数据的变化,重新计算并调整newOldSpaceLimit、newGlobalSpaceLimit、globalSpaceNativeLimit及增长因子。
  • 日志关键词:RecomputeLimits

Partial Old GC的CSet 选择策略

  • 函数方法:OldSpace::SelectCSet()
  • 说明:PartialGC执行时,优先选择存活对象数量少、回收代价小的Region进行回收。
  • 典型日志:
    Select CSet failure: number is too few
    Max evacuation size is 6_MB. The CSet Region number
    Select CSet success: number is

四、SharedHeap

1.SharedHeap结构

  • SharedOldSpace:共享老年代空间(不区分年轻代老年代),存放一般的共享对象。
  • SharedHugeObjectSpace:共享大对象空间,使用单独的Region存放一个大对象的空间。
  • SharedReadOnlySpace:共享只读空间,存放运行期间的只读数据。
  • SharedNonMovableSpace:共享不可移动空间,存放不可移动的对象。

注:SharedHeap用于线程间共享对象,提高效率并节省内存。共享堆不单独属于任何线程,保存具有共享价值的对象,提高对象的存活率,去除了SemiSpace类型。

五、特性

1.Smart GC

特性介绍

在应用性能敏感场景,通过将线程(SmartGC对worker线程和taskpool线程不生效)GC触发水线临时调整到线程的堆最大值(主线程默认448MB),尽量避免触发GC导致应用掉帧。如果敏感场景持续时间过久,对象分配已经达到了堆最大值,则还是会触发GC,且这次GC由于积累的对象太多,GC时间会相对较久。

支持敏感场景

  • 应用冷启动(默认支持)。
  • 应用滑动。
  • 应用点击页面跳转。
  • 超长帧。

该特性使能由系统侧进行管控,三方应用暂无接口直接调用。

日志关键词: SmartGC

交互流程

标记性能敏感场景。在进入和退出性能敏感场景时,在堆上标记,避免不必要的GC,维持高性能表现。

六、GC开发者调试接口

1.ArkTools.hintGC()

  • 调用方式:ArkTools.hintGC()
  • 接口类型:ArkTS接口。
  • 调用后,VM会判断是否适合进行full GC。如果后台场景中内存预期存活率低于设定值,则触发full GC;若判断为敏感状态,则不触发。
  • 使用场景:开发者提示系统进行GC。
  • 典型日志:无直接日志,仅区分外部触发(GCReason::TRIGGER_BY_JS)。
typescript 复制代码
// 首先需要声明接口
declare class ArkTools {
  static hintGC(): void;
}

@Entry
@Component
struct Index {
  @State message: string = 'Hello World';

  build() {
    Row() {
      Column() {
        Text(this.message)
          .fontSize(50)
          .fontWeight(FontWeight.Bold)
        Button("触发HintGC").onClick((event: ClickEvent) => {
          ArkTools.hintGC(); //方法内直接调用
        })
      }
      .width('100%')
    }
    .height('100%')
  }
}
相关推荐
爱笑的眼睛114 小时前
HarmonyOS 文件管理Kit 的应用场景深度解析
华为·harmonyos
HarmonyOS_SDK4 小时前
【FAQ】HarmonyOS SDK 闭源开放能力 — AppGallery Kit
harmonyos
SWUT胖虎4 小时前
ArkTS 自定义组件与 @Builder 区别总结
harmonyos·arkts·鸿蒙
SWUT胖虎4 小时前
ArkTS 中 @State 底层原理详解
java·list·harmonyos·鸿蒙
北风江畔(LuckyClover)6 小时前
鸿蒙应用开发(第一章:快速体验)
华为·harmonyos
大雷神6 小时前
HarmonyOS Canvas开发指南
harmonyos
北风江畔(LuckyClover)6 小时前
手戳一个HarmonyOS (鸿蒙)移动应用
华为·harmonyos
SWUT胖虎17 小时前
AlphabetIndexer组件 与 List 联动总结
list·harmonyos·arkts·鸿蒙
鸿蒙小白龙19 小时前
OpenHarmony轻量级内核LiteOS-M技术详解与应用实践
harmonyos·鸿蒙·鸿蒙系统·open harmony