物理内存与虚拟内存
- 物理内存(Physical Memory)
定义:物理内存是计算机硬件中的实际RAM(如DDR5内存条),直接通过总线与CPU连接,用于临时存储运行中的程序和数据。 - 虚拟内存(Virtual Memory)
定义:由操作系统管理的抽象内存层,通过结合物理内存和磁盘空间(如页面文件或交换分区),为程序提供连续且独立的内存空间。
用户只需要与虚拟内存地址打交道,而无需关心数据到底分配在哪里
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211112010169-135789450.png)
眼见为实
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250210174737262-2128893752.png)
物理页4K对齐
在Windows系统下,以4K为最小粒度,这个单位叫做物理页
,并以4K的整数倍分配内存。比如申请1k分配4k,申请5k分配8k
眼见为实
void page4k() {
for (int i = 0; i < 200; i++) {
//1k 的占用
LPVOID ptr = VirtualAlloc(NULL, 1024 * 1, MEM_RESERVE | MEM_COMMIT, PAGE_READWRITE);
printf("i=%d, 1k, address:%#0.8x \n", i + 1, ptr);
}
for (int i = 200; i < 400; i++) {
//5k 的占用
LPVOID ptr = VirtualAlloc(NULL, 1024 * 5, MEM_RESERVE | MEM_COMMIT, PAGE_READWRITE);
printf("i=%d, 5k, address:%#0.8x \n", i + 1, ptr);
}
getchar();
}
申请1k分配4k
申请5k分配8k
物理内存与虚拟内存如何映射?
Windows系统采用二叉树结构
(5层)来实现高效映射。
举个例子,某个32bit的内存地址为:0x77b01a42,其二进制为:01110,11110,11000,00001,101001000010
前20位
用来构建页表树
,实现物理页的的高效映射后12位
映射物理页的偏移量
操作系统以4K为一个单位对内存进行分组,4G内存=102410241024*4/(4/1024)=1048576物理页,如此庞大的物理页,,采用5层二叉树来提高索引效率
眼见为实:以notepad为例
任务管理:
Windbg:
可以看到非常明显的不同,任务管理器显示占用44.6mb内存,而windbg显示占用489.531mb内存,这是为什么呢?
答:显示逻辑不同,任务管理器显示的是Private WorkingSet,指的是物理内存的地址,即内存条上的内存
,而Windbg是显示映射到的物理页,Commit指的是虚拟内存地址,这包括内存条上的内存,pagefile,image
三种
眼见为实:可视化观察 虚拟地址=>物理地址
使用windbg进入内核态,这很重要,大家可以猜猜原因。
随便找一个字符串的内存地址
- 使用dp观察虚拟地址
- 使用!vtop 观察映射信息
- 使用!db观察物理地址
虚拟地址布局
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211111545211-1906923075.png)
眼见为实:空指针区与用户态区
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211113836880-425168400.png)
windows/linux在默认情况下,会开启ASLR,需要关闭此技术才能复现。
ASLR 是一种针对缓冲区溢出攻击等内存攻击技术而设计的安全特性。在没有 ASLR 的情况下,程序加载到内存中的位置通常是固定的,攻击者可以预测程序中各种模块(如可执行文件、动态链接库等)的加载地址,进而利用这些固定地址来构造恶意代码进行攻击,比如在缓冲区溢出攻击中精准定位跳转地址来执行恶意指令。
而启用 ASLR 后,操作系统在每次启动程序时会随机化程序的内存布局,包括可执行文件、动态链接库、堆、栈等的加载地址,使得攻击者难以准确预测内存地址,大大增加了攻击的难度。
Reserved与Commit
- Reserved
在虚拟地址上申请一段内存空间,此时操作系统也会同步创建页表树
,但此时并未映射到物理内存
,此时对该虚拟内存的读写会抛异常 - Commit
给页表树
调配真实的物理内存
,此时才能正常写入
眼见为实:Reserved
void mem_reserved() {
LPVOID ptr = VirtualAlloc(NULL, 4 * 1024, MEM_RESERVE, PAGE_READWRITE);
*(int*)(ptr) = 10; //在首地址上写入内容。
printf("num=%d", *(int*)ptr);
}
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211133704990-1155504597.png)
眼见为实:Commit
void mem_commit() {
LPVOID ptr = VirtualAlloc(NULL, 4 * 1024, MEM_RESERVE | MEM_COMMIT, PAGE_READWRITE);
*(int*)(ptr) = 10; //在首地址上写入内容。
printf("num=%d", *(int*)ptr);
}
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211133914074-1136935856.png)
NT堆
NT堆是 Windows NT 内核引入的内存管理组件,主要负责进程内的堆内存分配与释放。在 Windows 系统里,进程可以使用 NT 堆来动态分配和管理内存,比如程序中使用 malloc()(C 语言)、new(C++) 等函数进行内存分配时,底层通常就依赖 NT 堆机制。
上面说到,VirtualAlloc方法它会一次性分配 64k 整数倍的内存段,内部对象按4k的内存页对齐.
如果让application直接操作VirtualAlloc,难免会造成大量的内存浪费。为了提高内存性能与使用效率,Windows又提供了一层
抽象
,以提供更细颗粒度的内存管理。它的名字叫做NT堆
- 在32bit平台上:8byte为一个分配粒度
- 在64bit平台上:16btye为一个分配粒度
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211171755645-1869520473.png)
- CRT堆:C运行时使用的堆,默认是对NT堆的简单封装
- 托管堆:用作特殊用途的,自行实现的一套内存池管理机制。比如GC堆
从图中可以看出,使用NT与否取决于程序员本身。完全可以绕过NT堆,直接使用VirtualAlloc来分配内存,只要你接收内存浪费。
眼见为实:GC堆,底层使用VirtualAlloc分配内存
点击查看代码
static void Main(string[] args)
{
var rand = new Random();
List<string> list = new List<string>();
for (int i = 0; i < 100000; i++)
{
var str = string.Join(",", Enumerable.Range(0, rand.Next(1, 1000)));
list.Add(str);
Console.WriteLine($"i={i},length={str.Length}");
}
Console.ReadLine();
}
在bp KERNELBASE!VirtualAlloc 下断点
眼见为实:CRT堆/NT堆,底层使用VirtualAlloc分配内存
点击查看代码
#include <iostream>
#include <Windows.h>
void crt_c() {
for (int i = 0; i < 10000000; i++) {
int* ptr = (int*)malloc(sizeof(int) * 1000);
*(ptr) = 10;
printf("第 %d 次分配 \n", i);
}
}
在 bp ntdll!NtAllocateVirtualMemory 下断点
![](https://img2024.cnblogs.com/blog/1084317/202502/1084317-20250211173643496-1294846999.png)