【Linux】Linux 地址空间 + 页表映射的概念解析

前言:欢迎 各位光临本博客,这里小编带你直接手撕**,文章并不复杂,愿诸君**耐其心性,忘却杂尘,道有所长!!!!

IF'Maxue个人主页
🔥 个人专栏 :
《C语言》
《C++深度学习》
《Linux》
《数据结构》
《数学建模》

⛺️生活是默默的坚持,毅力是永久的享受。不破不立!

文章目录

Linux线程解析

一、进程与线程的核心区别

  • 进程 = 内核数据结构(如PCB) + 代码和数据(执行流)
  • 线程:进程内部的"执行分支",是更轻量的执行流

内核视角的资源与调度:

  • 进程:系统资源分配的基本单位(占内存、文件描述符等)
  • 线程:CPU调度的基本单位(被CPU直接调度执行)

二、地址空间:线程共享的"窗口"

进程访问资源的核心是"地址空间"------它像一个"窗口",通过这个窗口能看到进程拥有的所有资源(代码、数据、堆、栈等)。

创建进程时,系统会为它单独申请一套地址空间(窗口),包含所有资源;

而创建线程时,线程会共享进程的地址空间(同一个窗口):

(单进程的地址空间:一个窗口对应一个执行流)

(多线程共享地址空间:一个窗口对应多个执行流)

(多线程共享地址空间的结构:多个task_struct共用一套资源)

三、线程的本质:多执行流并行

  1. 资源分配的本质:划分虚拟地址

    地址空间里的虚拟地址,本质是"资源的代表"。比如代码区、数据区、堆区的虚拟地址范围,就是进程/线程能访问的资源范围。

  2. 多线程如何并行?

    多个线程(task_struct)共享同一地址空间,但可以分配不同的虚拟地址范围(比如执行不同函数),从而实现"同一进程内的并行执行":

(多线程在同一地址空间内执行不同函数,实现并行)

  1. 函数与代码区的划分

    函数本质是"一段连续的虚拟地址",线程执行不同函数,就是在代码区中选择不同的虚拟地址范围执行。

  2. 进程与线程的关系

    单进程可以看作"只有一个线程的特殊情况":

(单线程进程是多线程进程的特例)

四、Linux为什么用进程模拟线程?

Linux的线程并非单独设计,而是通过"轻量级进程(LWP)"模拟实现------复用了进程的内核管理代码(如task_struct、调度逻辑)。

原因很简单:

  • 复用现有进程管理代码,无需重新设计线程管理模块,降低开发成本;
  • 保持内核的简洁与健壮性。

(Linux复用进程内核代码管理线程,成本更低)

五、其他平台的线程实现

不同操作系统的线程实现不同:

  • Windows:单独设计"线程控制块(TCB)"管理线程,内核中需单独维护线程的调度信息,实现更复杂;
  • 核心思想一致:线程是调度单位,共享进程资源,但具体实现细节因系统而异。

六、Linux线程的调度与称呼

  • 操作系统视角:线程和进程都是"执行流",调度算法无需区分;
  • 硬件视角:Linux内核中无独立"TCB",用户态线程通过"轻量级进程(LWP)"与内核交互,每个用户态线程对应一个LWP;
  • 内核用task_struct统一描述进程和LWP,每个线程有自己的入口函数,被CPU当作独立执行流调度:

(每个线程的task_struct对应独立执行流,共享进程资源)

七、资源划分:共享与独占

  • 进程:强调"独占"(独立地址空间、资源),仅通过通信机制共享部分数据;
  • 线程:强调"共享"(同一地址空间、代码、数据、文件描述符等),独占资源包括线程栈、寄存器状态、程序计数器(PC)、线程私有数据(TLS)。

形象说:进程像"独立的公司",线程像"公司内的团队"------团队共享公司资源,各自执行不同任务,共同完成公司目标。

八、物理内存管理:4KB页框

硬件与系统对内存的管理,都以"4KB"为基本单位:

  • 磁盘文件、物理内存均按4KB块存储/管理,这个块称为"页框"或"页帧";
  • 内核用struct page描述每个4KB页框:

struct page结构体:描述4KB页框的属性)

页框的地址计算

  • 早期内核中,struct page会被组织成数组(如struct page mem[1048576]),该大小对应4GB物理内存(1048576×4KB=4GB),数组下标即页框索引;
  • 页框起始物理地址 = 数组下标 × 4KB;
  • 具体物理地址 = 页框起始地址 + 页内偏移(0~4095):

(物理地址由页框起始地址和页内偏移组成)

申请物理内存的本质

就是修改struct page数组的状态(标记某页框为"已分配"),建立"进程/线程"与"页框"的对应关系。

九、虚拟地址与页表映射

程序访问的是"虚拟地址",需通过"页表"转换为物理地址。

32位虚拟地址的划分(经典两级页表)

32位x86架构的经典两级页表中,虚拟地址被分为3部分:

  • 前10位:页目录索引;
  • 中10位:页表索引;
  • 后12位:页内偏移(4KB=2¹²,12位可覆盖0~4095的偏移范围)。

页表映射过程

  1. 用前10位查"页目录",找到对应"页表"的物理地址;
  2. 用中10位查"页表",找到目标"物理页框"的起始地址;
  3. 用后12位(页内偏移)定位到具体字节:

(页目录→页表→物理页框:虚拟地址到物理地址的转换)

附:简单线程创建示例(修正编译说明)

用C语言的pthread库创建线程(体现线程共享地址空间),编译时需链接pthread库(加-lpthread参数):

c 复制代码
#include <stdio.h>
#include <pthread.h>

// 共享变量(线程共享同一地址空间,可直接访问)
int shared = 0;

// 线程1执行函数
void *thread1(void *arg) {
    shared++;
    printf("线程1:shared = %d\n", shared);
    return NULL;
}

// 线程2执行函数
void *thread2(void *arg) {
    shared++;
    printf("线程2:shared = %d\n", shared);
    return NULL;
}

int main() {
    pthread_t tid1, tid2;
    // 创建线程
    pthread_create(&tid1, NULL, thread1, NULL);
    pthread_create(&tid2, NULL, thread2, NULL);
    // 等待线程结束(避免主线程提前退出)
    pthread_join(tid1, NULL);
    pthread_join(tid2, NULL);
    // 主线程也能访问shared
    printf("主线程:shared = %d\n", shared);
    return 0;
}

编译命令:gcc -o thread_demo thread_demo.c -lpthread

输出(共享变量被两个线程修改,顺序可能因调度略有差异):

复制代码
线程1:shared = 1
线程2:shared = 2
主线程:shared = 2

相关推荐
源码宝2 小时前
一套随访系统源码,医院随访管理系统源码,三级随访平台源码,技术框架:Java+Spring boot,Vue,Ant-Design+MySQL5
java·源码·软件开发·程序·随访·随访系统源码·三级随访
♡喜欢做梦2 小时前
Spring IOC
java·后端·spring
陌路202 小时前
操作系统(11)进程描述与控制--5种IO状态(1)
linux·ubuntu
skywalk81632 小时前
阿里云服务器FreeBSD新系统从登录、配置到升级:从14.1升级到FreeBSD 14.3 Release
linux·服务器·阿里云·freebsd
草莓熊Lotso2 小时前
Linux 基础开发工具入门:软件包管理器的全方位实操指南
linux·运维·服务器·c++·人工智能·网络协议·rpc
拾忆,想起2 小时前
TCP滑动窗口:网络世界的“智能流量阀门”
java·网络·数据库·网络协议·tcp/ip·php·哈希算法
摇滚侠2 小时前
Spring Boot3零基础教程,Reactive-Stream 发布订阅写法,笔记104 笔记105
java·spring boot·笔记
喜欢吃燃面2 小时前
Linux:make自动化和实战演练
linux·学习
顾安r3 小时前
11.8 脚本网页 推箱子
linux·前端·javascript·flask