LInux-多线程基础概念

文章目录


前言

从本章的多线程开始,我们开始进入Linux系统的尾声,所以,在学习多线程的过程中,我们也会逐步对之前的内容进行复习,以达到知识巩固的效果。


预备

页表详解

对于我们的已经被编译好的可执行程序,其实早已被按照区域被划分为了4KB为单位,我们称它为页帧

而内存其实也是被划分为了4KB为单位,且内存的IO基本单位也是4KB,我们称内存这样被划分的区域称之为页框

缺页中断

在程序刚开始被运行的时候,我们的数据刚开始都还在磁盘当中,这个时候我们页表所映射的其实是磁盘地址,如果用户这个时候访问一个还在磁盘中的数据,首先要经过页表,然后页表+MMU会发现该数据没有被加载到内存,就会发生缺页中断:先将磁盘的数据加载到内存,然后更改页表映射。

页表的映射

那么为什么页框和页帧为4KB呢? 这就要详细讲解页表是如何映射的。

首先提出一个数学问题,如果只有一个页表单纯地去映射所有地址至少需要多少空间?

在32位系统中,一个地址要占32个bit位并且有多达2^32个地址。

这样计算下来,居然至少多达32GB。所以页表肯定不是这样映射的。

页表其实被是被划分为N级页表的,在32位系统中,有一级页表和二级页表。

其中一级页表映射后10位bit位,二级页表映射中间的10位bit位。

通过这样的方式,我们就可以完成页表的映射,我们再来计算一次采用这样的方案需要多少空间。

这个时候就是MB为单位了,内存存储几十MB还是没有问题的。

一、多线程是什么?

之前我们所学习的信号知识里面,我们了解到了一个进程是可以拥有多个执行流的概念。 那么,一个进程拥有多个执行流有什么用呢? 答案是可以提高程序的工作效率 。

而在我们以往学习所写的代码程序,其实都是单进程单执行流程序。

那么多线程到底是什么? 我们又该如何理解多线程?

线程在进程内部执行,在进程中的每一个执行流都是一个线程,其中一个进程的每个线程都共享且运行同一份地址空间,在上面的图中,我们可以将一个task_struct理解为一个线程。

对于CPU而言,它的基本调度单位是线程,它调度的其实是线程。

为什么这样工作效率更高?

首先毋庸置疑的,多执行流在CPU中运行肯定比单执行流效率更高。

第二, 因为他们共享一部分数据,不像进程一样具有独立性,所以线程所占用的资源更少。

第三,CPU中有cache缓冲,它会根据局部性原理,会将可能用上的一部分内存数据(/4KB)都保存在CPU的cache区中,所以CPU调用多线程就会使得减少CPU的cache区频繁改变。

可以总结为

1.创建一个新线程的代价要比创建一个新进程小得多

2.与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多

3.线程占用的资源要比进程少很多

4.能充分利用多处理器的可并行数量

5.在等待慢速I/O操作结束的同时,程序可执行其他的计算任务

6.计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现

7.I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

轻量级进程

需要注意的是,在Linux系统中,其实并没有真正的线程概念,像Windows其实才具有真正的线程,在Linux系统中,我们采用的是轻量级进程(LWP:Light Weight Process) ,相对于其他系统的进程内核数据结构更加轻量化,并且也能达到多线程的效果。

就像上图所展示的,CPU所调度的是task_struct,Linux操作系统并没有为线程写一个数据结构。

线程是OS调度的基本单位,进程是承担OS资源的基本实体。


二、Pthread库

pthread_create

pthread库是一个第三方库,我们可以用它库中的pthread_create函数来在Linux系统中创建多线程。

#include <pthread.h>

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,

void *(*start_routine) (void *), void *arg);

Compile and link with -pthread.

参数 pthread_t *thread 是一个输出型函数,用于输出它创建出的线程的线程id。

typedef unsigned long int pthread_t;

参数 const pthread_attr_t *attr,也是一个输出型函数,用于输出该线程的属性数据。

参数 void* (*start_routine)(void *)是一个函数指针,是一个回调函数。

参数 void* arg 用于传递给void* (*start_routine)(void *)的参数。

示例代码如下

cpp 复制代码
#include <cstdio>
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <string>


void *threadRun(void *args)
{
    const std::string name = (char*) args;
    while (1)
    {
        std::cout << name << " : pid " << getpid() << "\n" << std::endl;
        sleep(1);
    }

}
int main()
{
    char name[64];
    pthread_t tid[5];
    for (int n = 0; n < 5; n++)
    {
        snprintf(name, sizeof name, "%s-%d", "thread", n + 1);
        pthread_create(tid + n, nullptr, threadRun,(void*)name);
        sleep(3);
    }

    while(1)
    {
        std::cout << "Main thread : pid " << getpid() << std::endl;
        sleep(3);
    }
    return 0;
}

因为pthread是第三方库,所以我们需要链接它的库,我们需要使用

g++ -o mythread mythread.cc -std=c++11 -lpthread

如果我们没有加-lpthread,则会出现下图报错

通过 ps aL 来查看线程状态

LWP(light weight process 轻量级进程)就是线程id。 它们的pid相同!


相关推荐
李的阿洁36 分钟前
OSPF的不规则区域
运维·服务器·网络
2401_8570262338 分钟前
时尚界的技术革新:Spring Boot与“衣依”服装销售
数据库·spring boot·性能优化
网安老伯43 分钟前
【2024版】最新kali linux入门及常用简单工具介绍(非常详细)零基础入门到精通,收藏这一篇就够了_kalilinux
linux·运维·服务器·开发语言·web安全·网络安全·xss
逸狼1 小时前
【JavaEE初阶】网络原理
服务器·网络·智能路由器
wdxylb2 小时前
在远程非桌面版Ubuntu中使用Qt5构建Hello World项目
linux·ubuntu
skywalk81632 小时前
install fcitx chinese input at FreeBSD14.1
运维·服务器·freebsd
小羊在奋斗2 小时前
【Linux】包管理器、vim详解及简单配置
linux·运维·vim
CS_素锦少年2 小时前
Linux_kernel字符设备驱动12
linux·运维·服务器
NineOne_豆浆狂魔2 小时前
Linux 缓冲区
linux·服务器·c
陈序缘3 小时前
Go语言实现长连接并发框架 - 消息
linux·服务器·开发语言·后端·golang