Linux:线程的概念、与进程区别及内核实现(线程一)

一、什么是线程?

线程(Thread)是进程内的独立执行流,是操作系统调度的基本单位。简单理解:进程是 "资源分配的容器",而线程是 "容器里真正干活的执行者"------ 一个进程至少包含一个主线程,多个线程共享进程的全部资源(虚拟地址空间、文件描述符、信号表等),但拥有独立的执行上下文(CPU 寄存器、栈空间)

线程的核心特点:

  1. 轻量级:创建和切换成本远低于进程(无需分配独立资源,仅需初始化执行上下文)
  2. 资源共享:同一进程内的线程共享进程的代码段、数据段、堆、文件描述符等,通信无需跨进程
  3. 独立调度:操作系统以线程为单位分配 CPU 时间片,多个线程可并发执行
  4. 协作性:线程间需通过同步机制(如互斥锁)避免共享资源竞争

二、线程与进程的核心区别(对比表)

对比维度 进程(Process) 线程(Thread)
资源分配单位 独立分配虚拟地址空间、文件描述符等 共享所属进程的所有资源
调度执行单位 不直接调度,内核调度其主线程 内核直接调度的基本单位
上下文切换成本 高(需切换页表、地址空间等) 低(仅切换 CPU 寄存器、栈)
独立性 高(一个进程崩溃不影响其他进程) 低(一个线程崩溃可能导致整个进程崩溃)
通信方式 复杂(管道、消息队列、共享内存等) 简单(共享全局变量、堆内存等)
内核实现(Linux) 独立 task_struct + 独立 mm_struct 独立 task_struct + 共享 mm_struct

三、Linux 中线程的内核实现:轻量级进程(LWP)

Linux 内核没有专门的线程结构体 ,线程的实现依赖 "轻量级进程(Lightweight Process, LWP)"------ 无论是进程还是线程,内核都用 task_struct(进程控制块)描述,二者的唯一区别是是否共享 mm_struct(虚拟地址空间)

  • 进程 :一个 task_struct 对应一个独立的 mm_struct(虚拟地址空间),即 "独占资源的主线程"
  • 线程 :多个 task_struct 共享同一个 mm_struct,即 "共享资源的执行流"

关键概念补充

  1. 线程组 ID(tgid) :同一进程内的所有线程(包括主线程)共享同一个 tgid(等于主线程的 PID),ps 命令显示的 PID 本质是 tgid
  2. 线程 ID(tid) :每个线程的 task_struct 有独立的 tid(内核层面的唯一标识),可通过 pthread_self()gettid() 获取
  3. 内核视角 :Linux 内核不区分 "进程" 和 "线程",只认 task_struct,线程的 "共享资源" 特性是通过 mm_struct 的共享实现的

四、线程的优缺点

优点:

  1. 并发效率高:创建、切换速度快,适合需要大量并发执行的场景(如 Web 服务器处理多请求)
  2. 通信成本低:共享进程资源,无需跨进程通信的复杂机制
  3. 资源利用率高:多个线程可充分利用 CPU 多核资源,提升程序吞吐量

缺点:

  1. 缺乏独立性:线程共享进程资源,一个线程的非法操作(如野指针)可能导致整个进程崩溃
  2. 同步复杂:多个线程访问共享资源时需手动同步(如加锁),否则会出现数据错乱(竞态条件)
  3. 调试难度大:多线程的执行顺序不确定,排查死锁、竞态条件等问题比单线程复杂

五、第一个 Linux 线程程序:Hello World(含代码)

Linux 中线程编程依赖 POSIX 线程库(pthread 库) ,需注意编译时链接 -lpthread 参数(否则会报未定义引用错误)

代码实现:

复制代码
#include <stdio.h>
#include <pthread.h>
#include <unistd.h>

// 线程执行函数:线程启动后会执行该函数
void* thread_func(void* arg) {
    // arg为传递给线程的参数(需强制类型转换)
    char* thread_name = (char*)arg;
    printf("Hello World! 我是%s,线程ID:%lu\n", thread_name, (unsigned long)pthread_self());
    sleep(1); // 模拟线程执行任务
    return NULL; // 线程退出,返回值为NULL
}

int main() {
    pthread_t tid; // 存储线程ID
    int ret;

    // 1. 创建线程
    // 参数:线程ID指针、线程属性(NULL为默认)、线程执行函数、传递给函数的参数
    ret = pthread_create(&tid, NULL, thread_func, (void*)"线程1");
    if (ret != 0) {
        perror("pthread_create failed");
        return -1;
    }

    printf("主线程ID:%lu,创建的线程ID:%lu\n", (unsigned long)pthread_self(), (unsigned long)tid);

    // 2. 回收线程(等待线程结束,避免线程成为僵尸线程)
    ret = pthread_join(tid, NULL);
    if (ret != 0) {
        perror("pthread_join failed");
        return -1;
    }

    printf("线程执行完毕,主线程退出\n");
    return 0;
}

关键说明:

  • pthread_self():获取当前线程的 ID(用户态线程 ID,非内核 tid)
  • pthread_create():创建线程,成功返回 0,失败返回错误码(需用 perrorstrerror 打印错误信息)
  • pthread_join():回收线程,阻塞主线程直到目标线程结束,避免线程资源泄漏

六、总结

  • 线程是进程内的独立执行流,共享进程资源,调度成本低
  • Linux 中线程本质是轻量级进程,通过 task_struct 描述,共享 mm_struct 区分于进程
  • 入门线程编程的核心是掌握 pthread 库的基本使用,理解线程的创建与回收流程

下一篇将详细讲解线程的创建、终止、回收的完整用法,以及线程退出状态的处理,敬请关注!

相关推荐
晓13132 小时前
第四章:Redis实战应用及常见问题(下篇)
java·数据库·缓存·wpf
量子炒饭大师2 小时前
【C++入门】Cyber霓虹镜像城的跨域通行证 —— 【友元(friend)】跨类协作破坏封装性?友元函数与友元类为你架起特权桥梁!
java·开发语言·c++·友元函数·友元类·friend
Linux蓝魔2 小时前
mysql-redis-kafka-es-ngnix安装调试
linux·服务器·mysql·kafka·es
没有bug.的程序员2 小时前
Spring Cloud Stream:消息驱动微服务的实战与 Kafka 集成终极指南
java·微服务·架构·kafka·stream·springcloud·消息驱动
weixin_449290012 小时前
EverMemOS Docker 运行环境搭建指南
运维·docker·容器
weixin_462446232 小时前
在 Linux / macOS 下使用 Docker 快速部署 PaddlePaddle + 运行 PaddleOCR 表格 PDF 解析示例
linux·macos·docker·paddleocr
{Hello World}2 小时前
Java内部类:深入解析四大类型与应用
java·开发语言
春日见2 小时前
C++单例模式 (Singleton Pattern)
java·运维·开发语言·驱动开发·算法·docker·单例模式
SamRol2 小时前
达梦数据库指令 及 在Spring Boot + MyBatis-Plus上的使用
java·数据库·spring boot·mybatis·达梦·intellij idea