malloc底层实现

malloc 本质是一个"用户态内存管理器" 它向操作系统批量要内存brk / mmap),然后在用户态 把这些内存切块、复用、合并、回收

从你调用 malloc 开始发生了什么?

cpp 复制代码
void* p = malloc(100);

真实流程大概是:

**malloc(100)

glibc 的 ptmalloc

  1. 在进程已有的堆中找合适的空闲块
  2. 找不到 → 向 OS 申请新内存
    ├─ 小块:brk 扩展堆
    └─ 大块:mmap 映射匿名内存**

重点
malloc 不是每次都系统调用,绝大多数是用户态完成的。

进程的"堆"长什么样?

低地址
┌────────────┐
│ text/code │
├────────────┤
│ data/bss │
├────────────┤
│ heap │ ← brk 向上增长
│ │
├────────────┤
│ ... │
├────────────┤
│ stack │ ← 向下增长
└────────────┘
高地址

heap 是 malloc 主要活动区域

brk() / sbrk() 扩展

连续虚拟地址

glibc malloc 的核心实现:ptmalloc

Linux 下默认是 ptmalloc

目标 解释
尽量 O(1)
少碎片 合并、分级
多线程友好 arena
减少系统调用 批量申请

malloc 管理的"内存块"结构

┌───────────────────────┐
│ prev_size (可选) │
├───────────────────────┤
│ size | flags │ ← 是否空闲 / mmap
├───────────────────────┤
│ 用户数据区 │ ← malloc 返回的指针
│ │
├───────────────────────┤
│ (空闲时) fd / bk │ ← 双向链表指针
└───────────────────────┘

size 字段里藏了"位标志"

size = 实际大小 | PREV_INUSE | IS_MMAPPED | ...
malloc 能 O(1) 合并相邻 free 块,靠的就是这些 flag。

free 链表 & bin 体系

glibc 用 多级 bin 管理不同大小的内存块。

fastbin

很小的内存(≤ 64B 左右)

单向链表 free

不合并,直接塞进去

极快,但容易产生碎片

small bin

精确大小分类

双向链表

free 时可以合并

large bin(大块)

按大小范围分

近似 best-fit

适合 1KB~128KB

unsorted bin

所有 free 的块先放这里

复制代码
free()
  ↓
unsorted bin
  ↓
malloc 时再决定进哪个 bin
减少 bin 操作开销

malloc 的查找策略

malloc(n) 的步骤

malloc(n) 的步骤

对齐 + 最小块大小修正

优先查:

fastbin

small bin

找不到:从 unsorted bin 拆

还没有:

large bin

再不行:

向 OS 要内存

什么时候用 brk?什么时候用 mmap?

申请大小 方式
小块 brk(堆)
大块 mmap

mmap 的特点

独立虚拟内存区

free 直接 munmap

不污染堆

避免堆碎片

相关推荐
To_OC5 小时前
LC 207 课程表:刚学图论那会儿,我连这是拓扑排序都没看出来
javascript·算法·leetcode
To_OC5 小时前
LC 208 实现 Trie 前缀树:曾被名字劝退,写完发现是送分题
javascript·算法·leetcode
BadBadBad__AK7 小时前
线段树维护区间 k 次方和
c++·数学·算法·stl
_清歌19 小时前
DSpark 深度解读:DeepSeek-V4 如何用「半自回归」把推理速度提升 85%
算法
统计实现局19 小时前
SVD 的三步走:双对角化、Givens 收敛、排序
算法
躬行见万象19 小时前
《VLA 系列》UniLab 强化训练 | G1 机器人 |复现
算法
统计实现局19 小时前
对称不定分解(Bunch-Kaufman):为什么 Cholesky 不够用
算法
统计实现局19 小时前
dqrsl 拆解:拿着 QR 结果能算出哪 5 种东西
算法
统计实现局19 小时前
为什么 Cholesky 求逆比 Gauss-Jordan 快一倍——行列式溢出防护详
算法