Golang内存模型总结1(mspan、mcache、mcentral、mheap)

1.内存模型

1.1 操作系统存储模型

从上到下分别是寄存器、高速缓存、内存、磁盘,其中越往上速度越快,空间越小,价格越高。

关键词是多级模型和动态切换

1.2 虚拟内存与物理内存

虚拟内存是一种内存管理技术,允许计算机使用比物理内存更多的内存资源,通过将部分内存存储在硬盘上的方式,扩展了系统的可用内存。

1.3 分页管理

操作系统会把虚拟内存和物理内存切割成固定的尺寸,于虚拟内存而言叫做"页",于物理内存而言叫"帧",原因如下:

  • 提高内存空间利用,减少外部碎片,内部碎片相对可控
  • 提高内外存交换的效率,更细的粒度带来了更高的灵活度
  • 与虚拟内存机制呼应,便于使用页表建立虚拟地址到物理地址之间的映射
  • linux 页/帧的大小固定为4KB,实践得到的经验值,太大的话会增加碎片率,太小的话增加分配频率影响效率

1.4 Golang内存模型

几个核心的设计要点:

  1. 空间换时间,一次缓存,多次复用:因为每次向操作系统申请内存的操作很重,那么不妨一次多申请一些,以备后用。Golang的堆mheap正是基于该思想产生的数据结构,对于操作系统而言,这是用户进程中缓存的内存;对于Go进程内部,堆是所有对象的内存起源。
  2. 多级缓存,实现无/细锁化 :堆是Go运行时最大的临界共享资源,这意味着每次存取都要加锁,很影响性能。为了解决这个问题,Golang依次细化粒度,建立了mcentral,mcache的模型:
    1. mheap:全局的内存起源,访问要加全局锁。数量只有1个
    2. mcentral:每种对象大小规格对应的缓存,锁的粒度仅仅局限于同一种规格里,全局划分为68份。(BigCache也用到了类似的思想)数量有68*2个(详细见2.3)
    3. mcache:每个P(即goroutine 内核线程)持有的一份内存缓存,访问时没有锁。数量等于P的数量
  3. 多级规格,提高利用率
    1. page:最小的存储单元,借鉴操作系统分页管理的思想,每个最小的存储单元也称之为页,但是大小为8KB
    2. mspan:最小的管理单元,大小是page的整数倍,从8B到80KB被划分为67种不同的规格,分配对象时,会根据大小映射到不同规则的mspan,从中获取空间。产生的特点
      1. 根据规格大小,产生了等级的制度,才使得central支持细锁化
      2. 消除了外部碎片,但是不可避免地会有内部碎片
      3. 宏观上能提高整体空间利用率

2.核心概念

2.1 内存单元mspan

mspan是Golang内存管理地最小单元,大小是page地整数倍,而且内部的页是连续的。

每个mspan会根据空间大小以及面向分配对象的大小,被划分为不同的等级,同等级的mspan会从属一个mcentral,最终被组织成链表,带有前后指针(prev/next),而且因为同属一个mcentral,所以是基于同一把互斥锁管理。

基于bitMap辅助快速找到空闲内存块,块大小为对应等级下的object大小,这里用到了Ctz64算法

go 复制代码
type mspan struct {
    // 标识前后节点的指针 
    next *mspan     
    prev *mspan    
    // ...
    // 起始地址
    startAddr uintptr 
    // 包含几页,页是连续的
    npages    uintptr 


    // 标识此前的位置都已被占用 
    freeindex uintptr
    // 最多可以存放多少个 object
    nelems uintptr // number of object in the span.


    // bitmap 每个 bit 对应一个 object 块,标识该块是否已被占用
    allocCache uint64
    // ...
    // 标识 mspan 等级,包含 class 和 noscan 两部分信息
    spanclass             spanClass    
    // ...
}

Ctz64算法是一种用于计算一个数的二进制表示中尾随零(trailing zeros)的数量的算法

2.2 内存单元等级 spanClass

mspan根据空间大小和面向分配对象的大小,被划分为67种等级,分别是1~67,实际上隐藏的0级用于处理更大的对象

mspan等级列表,<font style="color:rgb(25, 27, 31);">runtime/sizeclasses.go</font>文件里

  • class:mspan等级标识,1~67
  • bytes/obj:该大小规格的对象会从这个mspan里获取空间,创建对象过程中,大小会上取整为8B的整数倍,因此该表可以直接实现object到mspan等级的映射
  • bytes/span:该等级的mspan的总空间大小
  • object:该等级的mspan最多可以new多少个对象,也就是span/obj
  • tail waste:span%obj的值
  • max waste:当一个对象被分配在某个size class中时,由于对象大小与span大小不完全匹配,可能导致的内存空间未被充分利用的情况

以class 3的 mspan为例,class分配的object大小统一为24B,只有17~24B大小的object会被分配到class3,最坏情况为,object 大小为17B,浪费空间比如为 ((24-17)*341 + 8 ) / 8192 = 28.24%

每个object还有一个重要的属性是nocan,标识了object是否含有指针,在gc时是否需要展开标记。

golang里,把span class 和 nocan两个信息组装为一个uint8,形成完整的spanClass标识。高7位标识span等级,最后一位标识nocan信息。

go 复制代码
// A spanClass represents the size class and noscan-ness of a span.
//
// Each size class has a noscan spanClass and a scan spanClass. The
// noscan spanClass contains only noscan objects, which do not contain
// pointers and thus do not need to be scanned by the garbage
// collector.
type spanClass uint8

const (
	numSpanClasses = _NumSizeClasses << 1
	tinySpanClass  = spanClass(tinySizeClass<<1 | 1)
)

func makeSpanClass(sizeclass uint8, noscan bool) spanClass {
	return spanClass(sizeclass<<1) | spanClass(bool2int(noscan))
}

func (sc spanClass) sizeclass() int8 {
	return int8(sc >> 1)
}

func (sc spanClass) noscan() bool {
	return sc&1 != 0
}

2.3 线程缓存mcache

mcache是每个goroutine独有的缓存,因此没有锁。

mcache把每种span class等级的mspan各缓存了一个,并且因为nocan的值也有2种(有指针 无指针),所以总数是2*68=136个

mcache还有一个对象分配器 tiny allocator,用于处理小于16B对象的内存分配。

go 复制代码
type mcache struct {
	_ sys.NotInHeap

	// The following members are accessed on every malloc,
	// so they are grouped here for better caching.
	nextSample uintptr // trigger heap sample after allocating this many bytes
	scanAlloc  uintptr // bytes of scannable heap allocated

	// Allocator cache for tiny objects w/o pointers.
	// See "Tiny allocator" comment in malloc.go.

	// tiny points to the beginning of the current tiny block, or
	// nil if there is no current tiny block.
	//
	// tiny is a heap pointer. Since mcache is in non-GC'd memory,
	// we handle it by clearing it in releaseAll during mark
	// termination.
	//
	// tinyAllocs is the number of tiny allocations performed
	// by the P that owns this mcache.
	tiny       uintptr
	tinyoffset uintptr
	tinyAllocs uintptr

	// The rest is not accessed on every malloc.

	alloc [numSpanClasses]*mspan // spans to allocate from, indexed by spanClass

	stackcache [_NumStackOrders]stackfreelist

	// flushGen indicates the sweepgen during which this mcache
	// was last flushed. If flushGen != mheap_.sweepgen, the spans
	// in this mcache are stale and need to the flushed so they
	// can be swept. This is done in acquirep.
	flushGen atomic.Uint32
}

2.4 中心缓存mcentral

每个mcentral对应一种spanclass,而且聚合了该spanclass下的mspan。

mcentral下的msapn分为2个链表,有空间msapn链表partial和满空间mspan链表full

每个mcentral一把锁

注意partial和full链表都包含两组mspan,一组是已清扫的正在使用的spans,另一组是未清扫的正在使用的spans,在每个垃圾回收GC周期里,这两个角色会互换。

go 复制代码
// Central list of free objects of a given size.
type mcentral struct {
	_         sys.NotInHeap
	spanclass spanClass

	// partial and full contain two mspan sets: one of swept in-use
	// spans, and one of unswept in-use spans. These two trade
	// roles on each GC cycle. The unswept set is drained either by
	// allocation or by the background sweeper in every GC cycle,
	// so only two roles are necessary.
	//
	// sweepgen is increased by 2 on each GC cycle, so the swept
	// spans are in partial[sweepgen/2%2] and the unswept spans are in
	// partial[1-sweepgen/2%2]. Sweeping pops spans from the
	// unswept set and pushes spans that are still in-use on the
	// swept set. Likewise, allocating an in-use span pushes it
	// on the swept set.
	//
	// Some parts of the sweeper can sweep arbitrary spans, and hence
	// can't remove them from the unswept set, but will add the span
	// to the appropriate swept list. As a result, the parts of the
	// sweeper and mcentral that do consume from the unswept list may
	// encounter swept spans, and these should be ignored.
	partial [2]spanSet // list of spans with a free object
	full    [2]spanSet // list of spans with no free objects
}

2.5 全局堆缓存mheap

堆是操作系统虚拟内存的抽象,以页8KB为单位,其中页是作为最小内存存储单元的。

mheap可以把连续页组装成mspan。

全局内存基于bitMap标识使用情况,每个bit对应一页,为1标识已经被mspan组装。

通过heapArena聚合页,记录了页到mspan的映射信息(详见2.7)

建立空间页基数树索引radix tree index,辅助快速寻找空闲页(详见2.6)

是mcentral的持有者,持有所有spanClass下的mcentral,作为自身的缓存。

内存不够时,向操作系统申请,申请单位是heapArena(64M)

go 复制代码
type mheap struct {
    // 堆的全局锁
    lock mutex
    // 空闲页分配器,底层是多棵基数树组成的索引,每棵树对应 16 GB 内存空间
    pages pageAlloc 
    // 记录了所有的 mspan. 需要知道,所有 mspan 都是经由 mheap,使用连续空闲页组装生成的
    allspans []*mspan
    // heapAreana 数组,64 位系统下,二维数组容量为 [1][2^22]
    // 每个 heapArena 大小 64M,因此理论上,Golang 堆上限为 2^22*64M = 256T
    arenas [1 << arenaL1Bits]*[1 << arenaL2Bits]*heapArena
    // 多个 mcentral,总个数为 spanClass 的个数
    central [numSpanClasses]struct {
        mcentral mcentral
        // 用于内存地址对齐
        pad      [cpu.CacheLinePadSize - unsafe.Sizeof(mcentral{})%cpu.CacheLinePadSize]byte
    }
    // ...
}

Golang内存模型和分配机制

相关推荐
迷茫运维路12 分钟前
golang标准库path/filepath使用示例
运维·golang
m0_7482417019 分钟前
NVIDIA 的 Blackwell 架构:解析 B100、B200 和 GB200
架构
小白的一叶扁舟23 分钟前
Go之Walk框架详解
开发语言·后端·信息可视化·golang
詹姆斯爱研究Java40 分钟前
基于微服务的在线校园便民服务站的设计与实现
微服务·云原生·架构
Q_27437851092 小时前
springboot基于微信小程序的停车场预订系统
spring boot·后端·微信小程序
迷茫运维路3 小时前
golang标准库os/exec使用方法示例
运维·golang
Ai 编码助手3 小时前
高性能、并发安全的 Go 嵌入式缓存库 如何使用?
开发语言·缓存·golang
码农小旋风3 小时前
Java进程内缓存介绍
后端
胡尔摩斯.3 小时前
Micrometer+Zipkin 分布式链路追踪
java·后端·spring cloud
m0_748245174 小时前
湖仓一体架构解析:数仓架构选择(第48天)
架构