【Linux线程篇】探索Linux多线程:并行编程的入门指南

W...Y的主页 😊

代码仓库分享💕

Linux线程概念

什么是线程

在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是"一个进程内部的控制序列"一切进程至少都有一个执行线程线程在进程内部运行,本质是在进程地址空间内运行

在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流。

在Linux系统下,线程与进程的最终目的都是一样的,都是想要让程序并发执行,所以我们可以将代码进行分块执行,所以就要创建自己的tcb结构体来维护自己的上下文、优先级等等。但是Linux设计者认为pcb与tcb具有极度的相似性没必要设计单独设计数据结构和算法,直接复用既可,所以Linux中的线程也被称为"轻量化进程"!!!

所以进程是一个或多个执行流加页表加地址空间加代码和数据。进程在内核角度为承担分配系统资源的实体!!!

那多个执行流是怎么划分代码呢?

我们经常说申请内存和释放内存,所以我们应该对内存做管理,其实物理内存也会被划分为4kb(大部分划分规则)的数据块,而磁盘中的数据块也是4kb的,他们被我们称为页框或页帧。当我们内存与数据块的交互时就是以数据块为单位的交互。操作系统要管理内存,肯定要先描述再组织,所以内存有属于自己的结构体struct page,其结构体的内容也应该是记录一个数据块的状态,使用者是谁,是否被使用,是否可以交换等等。假如我们物理内存为4GB,其就有1048576个4kb数据块,我们就可以创建一个是结构体数组进行存储结构体内容。

其源码一部分:

所以我们的页表也不可能是所谓的kv关系,因为kv分别代表一个指针,再加上其对应权限可能有10个字节,但是如果是一一对应的关系其页表可能会有40GB大小,所以页表是怎么映射的呢?虚拟地址是32位二进制,划分为三个部分10位10位12位,其第一个10位被称为页目录,需要创建2^10个格子,第二个10位被称为页表,页目录保存的是二级页表的地址,所以页表应该有1024个,每个页表中有1024个页表项,每一个页表项中存放的是4kb内存块的起始地址(也就是页框的物理地址)。而我们的后12位的大小为4kb,所以我们又知道其对应的起始地址,所以我们对应的起始物理地址+后12位偏移量就是最终所访问的数据。所以我们的后12位被称为页内偏移。

我们也可以再页表中加上标志位,让CPU与页表中的标志位进行比对,如果相同就可以访问物理内存的内容。

所以给不同的线程分配不同的区域,本质就是让不同的线程各自看到全部页表的子集。

那是怎么才能看到不同的页表呢?这里我们得转到应用层面来看,所以让我们先了解一些系统调用函数:

第一个参数线程id,第二个参数线程属性,第三个参数是返回值void*参数也是void*的函数指针,第四个参数是我们给第三个函数指针所指向的函数所传递的参数。

一般情况下我们的第二个参数可以写nullptr。

注意:在我们使用pthread库中函数时,在编译时必须链接上pthread库!!!

这样我们就可以简短写一个代码:

cpp 复制代码
#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include <sys/types.h>

void *newthreadrun(void *args)
{
    while (true)
    {
        std::cout << "I am new thread, pid: " << getpid() << std::endl;
        sleep(1);
    }
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, newthreadrun, nullptr);

    while (true)
    {
        std::cout << "I am main thread, pid: " << getpid() << std::endl;
        sleep(1);
    }
}

这时我们的代码就有两个执行流,我们从main函数开始运行,当走到pthread_create函数时新线程创建成功会进入newthreadrun函数中去,主线程继续往下执行即可。

在这里我们只能看到一个进程,我们可以使用ps -aL查看轻量级进程就可以看到两个进程了。

主线程的PID==LWP,但是其线程所有的PID都是相同的。所以我们在回归到上述问题上每一句代码都有其对应的虚拟地址,主线程拥有的是主函数的虚拟地址其余线程得到的是其他函数的虚拟地址,对应其页表就可以访问到不同的数据。

所谓的Linux就根本没有线程这个说法,只有轻量化进程,所以对应的Linux内核就没有对线程的系统调用只有对轻量化进程的系统调用。而用户只知道线程不知道轻量化进程,所以设计者在用户和内核之间设计一个软件层pthread库------原生线程库。这个库的作用就是将Linux的轻量级进程系统调用进行封装,转化成线程相关接口提供给用户。

轻量级进程也有直接的系统调用,但是太复杂一般没有人想用!!!


以上就是本次全部内容,感谢大家观看!

相关推荐
程序员龙叔9 小时前
编写高质量 Skill 系列 -- 如何设计需求分析与用例生成的 SKILL
自动化测试·软件测试·python·软件测试工程师·接口测试·性能测试·skill·ai测试
_wyt00110 小时前
洛谷 B3930 [GESP202312 五级] 烹饪问题 题解
c++·gesp
NE_STOP12 小时前
Vide Coding--AI编程工具的选择
java
大树8812 小时前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
用户83562907805112 小时前
使用 Python 操作 Word 内容控件
后端·python
摇滚侠12 小时前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
施小赞12 小时前
普通 RAG vs GraphRAG 核心对比
人工智能·ai
码云数智-园园12 小时前
C++20 Modules 模块详解
java·开发语言·spring
程序员黑豆12 小时前
JDK 下载安装与配置详细教程
java·前端·ai编程
霸道流氓气质12 小时前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务