【Linux】Linux 地址空间 + 页表映射的概念解析

前言:欢迎 各位光临本博客,这里小编带你直接手撕**,文章并不复杂,愿诸君**耐其心性,忘却杂尘,道有所长!!!!

IF'Maxue个人主页
🔥 个人专栏 :
《C语言》
《C++深度学习》
《Linux》
《数据结构》
《数学建模》

⛺️生活是默默的坚持,毅力是永久的享受。不破不立!

文章目录

Linux线程解析

一、进程与线程的核心区别

  • 进程 = 内核数据结构(如PCB) + 代码和数据(执行流)
  • 线程:进程内部的"执行分支",是更轻量的执行流

内核视角的资源与调度:

  • 进程:系统资源分配的基本单位(占内存、文件描述符等)
  • 线程:CPU调度的基本单位(被CPU直接调度执行)

二、地址空间:线程共享的"窗口"

进程访问资源的核心是"地址空间"------它像一个"窗口",通过这个窗口能看到进程拥有的所有资源(代码、数据、堆、栈等)。

创建进程时,系统会为它单独申请一套地址空间(窗口),包含所有资源;

而创建线程时,线程会共享进程的地址空间(同一个窗口):

(单进程的地址空间:一个窗口对应一个执行流)

(多线程共享地址空间:一个窗口对应多个执行流)

(多线程共享地址空间的结构:多个task_struct共用一套资源)

三、线程的本质:多执行流并行

  1. 资源分配的本质:划分虚拟地址

    地址空间里的虚拟地址,本质是"资源的代表"。比如代码区、数据区、堆区的虚拟地址范围,就是进程/线程能访问的资源范围。

  2. 多线程如何并行?

    多个线程(task_struct)共享同一地址空间,但可以分配不同的虚拟地址范围(比如执行不同函数),从而实现"同一进程内的并行执行":

(多线程在同一地址空间内执行不同函数,实现并行)

  1. 函数与代码区的划分

    函数本质是"一段连续的虚拟地址",线程执行不同函数,就是在代码区中选择不同的虚拟地址范围执行。

  2. 进程与线程的关系

    单进程可以看作"只有一个线程的特殊情况":

(单线程进程是多线程进程的特例)

四、Linux为什么用进程模拟线程?

Linux的线程并非单独设计,而是通过"轻量级进程(LWP)"模拟实现------复用了进程的内核管理代码(如task_struct、调度逻辑)。

原因很简单:

  • 复用现有进程管理代码,无需重新设计线程管理模块,降低开发成本;
  • 保持内核的简洁与健壮性。

(Linux复用进程内核代码管理线程,成本更低)

五、其他平台的线程实现

不同操作系统的线程实现不同:

  • Windows:单独设计"线程控制块(TCB)"管理线程,内核中需单独维护线程的调度信息,实现更复杂;
  • 核心思想一致:线程是调度单位,共享进程资源,但具体实现细节因系统而异。

六、Linux线程的调度与称呼

  • 操作系统视角:线程和进程都是"执行流",调度算法无需区分;
  • 硬件视角:Linux内核中无独立"TCB",用户态线程通过"轻量级进程(LWP)"与内核交互,每个用户态线程对应一个LWP;
  • 内核用task_struct统一描述进程和LWP,每个线程有自己的入口函数,被CPU当作独立执行流调度:

(每个线程的task_struct对应独立执行流,共享进程资源)

七、资源划分:共享与独占

  • 进程:强调"独占"(独立地址空间、资源),仅通过通信机制共享部分数据;
  • 线程:强调"共享"(同一地址空间、代码、数据、文件描述符等),独占资源包括线程栈、寄存器状态、程序计数器(PC)、线程私有数据(TLS)。

形象说:进程像"独立的公司",线程像"公司内的团队"------团队共享公司资源,各自执行不同任务,共同完成公司目标。

八、物理内存管理:4KB页框

硬件与系统对内存的管理,都以"4KB"为基本单位:

  • 磁盘文件、物理内存均按4KB块存储/管理,这个块称为"页框"或"页帧";
  • 内核用struct page描述每个4KB页框:

struct page结构体:描述4KB页框的属性)

页框的地址计算

  • 早期内核中,struct page会被组织成数组(如struct page mem[1048576]),该大小对应4GB物理内存(1048576×4KB=4GB),数组下标即页框索引;
  • 页框起始物理地址 = 数组下标 × 4KB;
  • 具体物理地址 = 页框起始地址 + 页内偏移(0~4095):

(物理地址由页框起始地址和页内偏移组成)

申请物理内存的本质

就是修改struct page数组的状态(标记某页框为"已分配"),建立"进程/线程"与"页框"的对应关系。

九、虚拟地址与页表映射

程序访问的是"虚拟地址",需通过"页表"转换为物理地址。

32位虚拟地址的划分(经典两级页表)

32位x86架构的经典两级页表中,虚拟地址被分为3部分:

  • 前10位:页目录索引;
  • 中10位:页表索引;
  • 后12位:页内偏移(4KB=2¹²,12位可覆盖0~4095的偏移范围)。

页表映射过程

  1. 用前10位查"页目录",找到对应"页表"的物理地址;
  2. 用中10位查"页表",找到目标"物理页框"的起始地址;
  3. 用后12位(页内偏移)定位到具体字节:

(页目录→页表→物理页框:虚拟地址到物理地址的转换)

附:简单线程创建示例(修正编译说明)

用C语言的pthread库创建线程(体现线程共享地址空间),编译时需链接pthread库(加-lpthread参数):

c 复制代码
#include <stdio.h>
#include <pthread.h>

// 共享变量(线程共享同一地址空间,可直接访问)
int shared = 0;

// 线程1执行函数
void *thread1(void *arg) {
    shared++;
    printf("线程1:shared = %d\n", shared);
    return NULL;
}

// 线程2执行函数
void *thread2(void *arg) {
    shared++;
    printf("线程2:shared = %d\n", shared);
    return NULL;
}

int main() {
    pthread_t tid1, tid2;
    // 创建线程
    pthread_create(&tid1, NULL, thread1, NULL);
    pthread_create(&tid2, NULL, thread2, NULL);
    // 等待线程结束(避免主线程提前退出)
    pthread_join(tid1, NULL);
    pthread_join(tid2, NULL);
    // 主线程也能访问shared
    printf("主线程:shared = %d\n", shared);
    return 0;
}

编译命令:gcc -o thread_demo thread_demo.c -lpthread

输出(共享变量被两个线程修改,顺序可能因调度略有差异):

复制代码
线程1:shared = 1
线程2:shared = 2
主线程:shared = 2

相关推荐
V***u4531 天前
MS SQL Server partition by 函数实战二 编排考场人员
java·服务器·开发语言
Hard but lovely1 天前
linux: pthread库的使用和理解
linux
这是程序猿1 天前
基于java的ssm框架旅游在线平台
java·开发语言·spring boot·spring·旅游·旅游在线平台
i***t9191 天前
基于SpringBoot和PostGIS的云南与缅甸的千里边境线实战
java·spring boot·spring
k***08291 天前
【监控】spring actuator源码速读
java·spring boot·spring
麦麦鸡腿堡1 天前
Java_网络编程_InetAddress类与Socket类
java·服务器·网络
vx_dmxq2111 天前
【PHP考研互助系统】(免费领源码+演示录像)|可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·spring boot·mysql·考研·微信小程序·小程序·php
5***g2981 天前
新手如何快速搭建一个Springboot项目
java·spring boot·后端
daidaidaiyu1 天前
Jetlinks 物联网平台 开源版学习源码分析
java·mqtt·rxjava·tcp
这儿有一堆花1 天前
Kali Linux:探测存活到挖掘漏洞
linux·运维·服务器