LInux-多线程基础概念

文章目录


前言

从本章的多线程开始,我们开始进入Linux系统的尾声,所以,在学习多线程的过程中,我们也会逐步对之前的内容进行复习,以达到知识巩固的效果。


预备

页表详解

对于我们的已经被编译好的可执行程序,其实早已被按照区域被划分为了4KB为单位,我们称它为页帧

而内存其实也是被划分为了4KB为单位,且内存的IO基本单位也是4KB,我们称内存这样被划分的区域称之为页框

缺页中断

在程序刚开始被运行的时候,我们的数据刚开始都还在磁盘当中,这个时候我们页表所映射的其实是磁盘地址,如果用户这个时候访问一个还在磁盘中的数据,首先要经过页表,然后页表+MMU会发现该数据没有被加载到内存,就会发生缺页中断:先将磁盘的数据加载到内存,然后更改页表映射。

页表的映射

那么为什么页框和页帧为4KB呢? 这就要详细讲解页表是如何映射的。

首先提出一个数学问题,如果只有一个页表单纯地去映射所有地址至少需要多少空间?

在32位系统中,一个地址要占32个bit位并且有多达2^32个地址。

这样计算下来,居然至少多达32GB。所以页表肯定不是这样映射的。

页表其实被是被划分为N级页表的,在32位系统中,有一级页表和二级页表。

其中一级页表映射后10位bit位,二级页表映射中间的10位bit位。

通过这样的方式,我们就可以完成页表的映射,我们再来计算一次采用这样的方案需要多少空间。

这个时候就是MB为单位了,内存存储几十MB还是没有问题的。

一、多线程是什么?

之前我们所学习的信号知识里面,我们了解到了一个进程是可以拥有多个执行流的概念。 那么,一个进程拥有多个执行流有什么用呢? 答案是可以提高程序的工作效率 。

而在我们以往学习所写的代码程序,其实都是单进程单执行流程序。

那么多线程到底是什么? 我们又该如何理解多线程?

线程在进程内部执行,在进程中的每一个执行流都是一个线程,其中一个进程的每个线程都共享且运行同一份地址空间,在上面的图中,我们可以将一个task_struct理解为一个线程。

对于CPU而言,它的基本调度单位是线程,它调度的其实是线程。

为什么这样工作效率更高?

首先毋庸置疑的,多执行流在CPU中运行肯定比单执行流效率更高。

第二, 因为他们共享一部分数据,不像进程一样具有独立性,所以线程所占用的资源更少。

第三,CPU中有cache缓冲,它会根据局部性原理,会将可能用上的一部分内存数据(/4KB)都保存在CPU的cache区中,所以CPU调用多线程就会使得减少CPU的cache区频繁改变。

可以总结为

1.创建一个新线程的代价要比创建一个新进程小得多

2.与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多

3.线程占用的资源要比进程少很多

4.能充分利用多处理器的可并行数量

5.在等待慢速I/O操作结束的同时,程序可执行其他的计算任务

6.计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现

7.I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

轻量级进程

需要注意的是,在Linux系统中,其实并没有真正的线程概念,像Windows其实才具有真正的线程,在Linux系统中,我们采用的是轻量级进程(LWP:Light Weight Process) ,相对于其他系统的进程内核数据结构更加轻量化,并且也能达到多线程的效果。

就像上图所展示的,CPU所调度的是task_struct,Linux操作系统并没有为线程写一个数据结构。

线程是OS调度的基本单位,进程是承担OS资源的基本实体。


二、Pthread库

pthread_create

pthread库是一个第三方库,我们可以用它库中的pthread_create函数来在Linux系统中创建多线程。

#include <pthread.h>

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,

void *(*start_routine) (void *), void *arg);

Compile and link with -pthread.

参数 pthread_t *thread 是一个输出型函数,用于输出它创建出的线程的线程id。

typedef unsigned long int pthread_t;

参数 const pthread_attr_t *attr,也是一个输出型函数,用于输出该线程的属性数据。

参数 void* (*start_routine)(void *)是一个函数指针,是一个回调函数。

参数 void* arg 用于传递给void* (*start_routine)(void *)的参数。

示例代码如下

cpp 复制代码
#include <cstdio>
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <string>


void *threadRun(void *args)
{
    const std::string name = (char*) args;
    while (1)
    {
        std::cout << name << " : pid " << getpid() << "\n" << std::endl;
        sleep(1);
    }

}
int main()
{
    char name[64];
    pthread_t tid[5];
    for (int n = 0; n < 5; n++)
    {
        snprintf(name, sizeof name, "%s-%d", "thread", n + 1);
        pthread_create(tid + n, nullptr, threadRun,(void*)name);
        sleep(3);
    }

    while(1)
    {
        std::cout << "Main thread : pid " << getpid() << std::endl;
        sleep(3);
    }
    return 0;
}

因为pthread是第三方库,所以我们需要链接它的库,我们需要使用

g++ -o mythread mythread.cc -std=c++11 -lpthread

如果我们没有加-lpthread,则会出现下图报错

通过 ps aL 来查看线程状态

LWP(light weight process 轻量级进程)就是线程id。 它们的pid相同!


相关推荐
可问 可问春风22 分钟前
Linux 找回 Root 密码(多发行版本)
linux·运维·chrome
木子欢儿3 小时前
Debian系统清理垃圾
linux·运维·服务器·debian
字节源流3 小时前
【SpringMVC】常用注解:@SessionAttributes
java·服务器·前端
谷晓光3 小时前
python中print函数的flush如何使用
linux·服务器·数据库
Hacker_Albert3 小时前
Linux 内核模块签名
linux
AdrichPro4 小时前
4、linux c 进程
linux·运维·服务器·c语言
2301_779503766 小时前
K8s的部署
linux·容器·kubernetes
pk_xz1234566 小时前
使用 Flask 进行简单服务器改造的详细步骤和代码
服务器·python·flask
why—空空6 小时前
linux系统CentOS 7版本搭建NFS共享存储
linux·运维·centos
不甘平凡--liang7 小时前
Linux Nginx安装部署、注册服务
linux·运维·服务器