1.内存模型
1.1 操作系统存储模型
从上到下分别是寄存器、高速缓存、内存、磁盘,其中越往上速度越快,空间越小,价格越高。
关键词是多级模型和动态切换
1.2 虚拟内存与物理内存
虚拟内存是一种内存管理技术,允许计算机使用比物理内存更多的内存资源,通过将部分内存存储在硬盘上的方式,扩展了系统的可用内存。
1.3 分页管理
操作系统会把虚拟内存和物理内存切割成固定的尺寸,于虚拟内存而言叫做"页",于物理内存而言叫"帧",原因如下:
- 提高内存空间利用,减少外部碎片,内部碎片相对可控
- 提高内外存交换的效率,更细的粒度带来了更高的灵活度
- 与虚拟内存机制呼应,便于使用页表建立虚拟地址到物理地址之间的映射
- linux 页/帧的大小固定为4KB,实践得到的经验值,太大的话会增加碎片率,太小的话增加分配频率影响效率
1.4 Golang内存模型
几个核心的设计要点:
- 空间换时间,一次缓存,多次复用:因为每次向操作系统申请内存的操作很重,那么不妨一次多申请一些,以备后用。Golang的堆mheap正是基于该思想产生的数据结构,对于操作系统而言,这是用户进程中缓存的内存;对于Go进程内部,堆是所有对象的内存起源。
- 多级缓存,实现无/细锁化 :堆是Go运行时最大的临界共享资源,这意味着每次存取都要加锁,很影响性能。为了解决这个问题,Golang依次细化粒度,建立了mcentral,mcache的模型:
- mheap:全局的内存起源,访问要加全局锁。数量只有1个
- mcentral:每种对象大小规格对应的缓存,锁的粒度仅仅局限于同一种规格里,全局划分为68份。(BigCache也用到了类似的思想)数量有68*2个(详细见2.3)
- mcache:每个P(即goroutine 内核线程)持有的一份内存缓存,访问时没有锁。数量等于P的数量
- 多级规格,提高利用率 :
- page:最小的存储单元,借鉴操作系统分页管理的思想,每个最小的存储单元也称之为页,但是大小为8KB
- mspan:最小的管理单元,大小是page的整数倍,从8B到80KB被划分为67种不同的规格,分配对象时,会根据大小映射到不同规则的mspan,从中获取空间。产生的特点
- 根据规格大小,产生了等级的制度,才使得central支持细锁化
- 消除了外部碎片,但是不可避免地会有内部碎片
- 宏观上能提高整体空间利用率
2.核心概念
2.1 内存单元mspan
mspan是Golang内存管理地最小单元,大小是page地整数倍,而且内部的页是连续的。
每个mspan会根据空间大小以及面向分配对象的大小,被划分为不同的等级,同等级的mspan会从属一个mcentral,最终被组织成链表,带有前后指针(prev/next),而且因为同属一个mcentral,所以是基于同一把互斥锁管理。
基于bitMap辅助快速找到空闲内存块,块大小为对应等级下的object大小,这里用到了Ctz64算法
go
type mspan struct {
// 标识前后节点的指针
next *mspan
prev *mspan
// ...
// 起始地址
startAddr uintptr
// 包含几页,页是连续的
npages uintptr
// 标识此前的位置都已被占用
freeindex uintptr
// 最多可以存放多少个 object
nelems uintptr // number of object in the span.
// bitmap 每个 bit 对应一个 object 块,标识该块是否已被占用
allocCache uint64
// ...
// 标识 mspan 等级,包含 class 和 noscan 两部分信息
spanclass spanClass
// ...
}
Ctz64算法是一种用于计算一个数的二进制表示中尾随零(trailing zeros)的数量的算法
2.2 内存单元等级 spanClass
mspan根据空间大小和面向分配对象的大小,被划分为67种等级,分别是1~67,实际上隐藏的0级用于处理更大的对象
mspan等级列表,<font style="color:rgb(25, 27, 31);">runtime/sizeclasses.go</font>
文件里
- class:mspan等级标识,1~67
- bytes/obj:该大小规格的对象会从这个mspan里获取空间,创建对象过程中,大小会上取整为8B的整数倍,因此该表可以直接实现object到mspan等级的映射
- bytes/span:该等级的mspan的总空间大小
- object:该等级的mspan最多可以new多少个对象,也就是span/obj
- tail waste:span%obj的值
- max waste:当一个对象被分配在某个
size class
中时,由于对象大小与span
大小不完全匹配,可能导致的内存空间未被充分利用的情况
以class 3的 mspan为例,class分配的object大小统一为24B,只有17~24B大小的object会被分配到class3,最坏情况为,object 大小为17B,浪费空间比如为 ((24-17)*341 + 8 ) / 8192 = 28.24%
每个object还有一个重要的属性是nocan,标识了object是否含有指针,在gc时是否需要展开标记。
golang里,把span class 和 nocan两个信息组装为一个uint8,形成完整的spanClass标识。高7位标识span等级,最后一位标识nocan信息。
go
// A spanClass represents the size class and noscan-ness of a span.
//
// Each size class has a noscan spanClass and a scan spanClass. The
// noscan spanClass contains only noscan objects, which do not contain
// pointers and thus do not need to be scanned by the garbage
// collector.
type spanClass uint8
const (
numSpanClasses = _NumSizeClasses << 1
tinySpanClass = spanClass(tinySizeClass<<1 | 1)
)
func makeSpanClass(sizeclass uint8, noscan bool) spanClass {
return spanClass(sizeclass<<1) | spanClass(bool2int(noscan))
}
func (sc spanClass) sizeclass() int8 {
return int8(sc >> 1)
}
func (sc spanClass) noscan() bool {
return sc&1 != 0
}
2.3 线程缓存mcache
mcache是每个goroutine独有的缓存,因此没有锁。
mcache把每种span class等级的mspan各缓存了一个,并且因为nocan的值也有2种(有指针 无指针),所以总数是2*68=136个
mcache还有一个对象分配器 tiny allocator,用于处理小于16B对象的内存分配。
go
type mcache struct {
_ sys.NotInHeap
// The following members are accessed on every malloc,
// so they are grouped here for better caching.
nextSample uintptr // trigger heap sample after allocating this many bytes
scanAlloc uintptr // bytes of scannable heap allocated
// Allocator cache for tiny objects w/o pointers.
// See "Tiny allocator" comment in malloc.go.
// tiny points to the beginning of the current tiny block, or
// nil if there is no current tiny block.
//
// tiny is a heap pointer. Since mcache is in non-GC'd memory,
// we handle it by clearing it in releaseAll during mark
// termination.
//
// tinyAllocs is the number of tiny allocations performed
// by the P that owns this mcache.
tiny uintptr
tinyoffset uintptr
tinyAllocs uintptr
// The rest is not accessed on every malloc.
alloc [numSpanClasses]*mspan // spans to allocate from, indexed by spanClass
stackcache [_NumStackOrders]stackfreelist
// flushGen indicates the sweepgen during which this mcache
// was last flushed. If flushGen != mheap_.sweepgen, the spans
// in this mcache are stale and need to the flushed so they
// can be swept. This is done in acquirep.
flushGen atomic.Uint32
}
2.4 中心缓存mcentral
每个mcentral对应一种spanclass,而且聚合了该spanclass下的mspan。
mcentral下的msapn分为2个链表,有空间msapn链表partial和满空间mspan链表full
每个mcentral一把锁
注意partial和full链表都包含两组mspan,一组是已清扫的正在使用的spans,另一组是未清扫的正在使用的spans,在每个垃圾回收GC周期里,这两个角色会互换。
go
// Central list of free objects of a given size.
type mcentral struct {
_ sys.NotInHeap
spanclass spanClass
// partial and full contain two mspan sets: one of swept in-use
// spans, and one of unswept in-use spans. These two trade
// roles on each GC cycle. The unswept set is drained either by
// allocation or by the background sweeper in every GC cycle,
// so only two roles are necessary.
//
// sweepgen is increased by 2 on each GC cycle, so the swept
// spans are in partial[sweepgen/2%2] and the unswept spans are in
// partial[1-sweepgen/2%2]. Sweeping pops spans from the
// unswept set and pushes spans that are still in-use on the
// swept set. Likewise, allocating an in-use span pushes it
// on the swept set.
//
// Some parts of the sweeper can sweep arbitrary spans, and hence
// can't remove them from the unswept set, but will add the span
// to the appropriate swept list. As a result, the parts of the
// sweeper and mcentral that do consume from the unswept list may
// encounter swept spans, and these should be ignored.
partial [2]spanSet // list of spans with a free object
full [2]spanSet // list of spans with no free objects
}
2.5 全局堆缓存mheap
堆是操作系统虚拟内存的抽象,以页8KB为单位,其中页是作为最小内存存储单元的。
mheap可以把连续页组装成mspan。
全局内存基于bitMap标识使用情况,每个bit对应一页,为1标识已经被mspan组装。
通过heapArena聚合页,记录了页到mspan的映射信息(详见2.7)
建立空间页基数树索引radix tree index,辅助快速寻找空闲页(详见2.6)
是mcentral的持有者,持有所有spanClass下的mcentral,作为自身的缓存。
内存不够时,向操作系统申请,申请单位是heapArena(64M)
go
type mheap struct {
// 堆的全局锁
lock mutex
// 空闲页分配器,底层是多棵基数树组成的索引,每棵树对应 16 GB 内存空间
pages pageAlloc
// 记录了所有的 mspan. 需要知道,所有 mspan 都是经由 mheap,使用连续空闲页组装生成的
allspans []*mspan
// heapAreana 数组,64 位系统下,二维数组容量为 [1][2^22]
// 每个 heapArena 大小 64M,因此理论上,Golang 堆上限为 2^22*64M = 256T
arenas [1 << arenaL1Bits]*[1 << arenaL2Bits]*heapArena
// 多个 mcentral,总个数为 spanClass 的个数
central [numSpanClasses]struct {
mcentral mcentral
// 用于内存地址对齐
pad [cpu.CacheLinePadSize - unsafe.Sizeof(mcentral{})%cpu.CacheLinePadSize]byte
}
// ...
}