【Linux】线程池项目详解

回避、躲闪、辗转腾挪都毫无作用，
既然来的总是要来，
迎着刀锋而上恐怕是最好的选择，
起码节约时间。
--- 廖一梅《像我这样笨拙地生活》---

线程池项目

[1 线程基础](#1 线程基础)
[2 什么是线程池](#2 什么是线程池)
[3 线程池工作原理](#3 线程池工作原理)
[4 构建线程池](#4 构建线程池)
- [4.1 框架搭建](#4.1 框架搭建)
- [4.3 HandlerTask函数](#4.3 HandlerTask函数)
- [4.3 基础函数](#4.3 基础函数)
- [4.4 单例模式改造](#4.4 单例模式改造)
- [4.5 测试运行](#4.5 测试运行)
[5 总结](#5 总结)

1 线程基础

线程我们已经学习的差不多了，从线程的概念：

线程的概念我们先从虚拟内存和物理内存之间的页表开始谈起

虚拟内存和物理内存的映射是通过一个二维数组进行的映射，每个元素指向物理内存的 4KB内存块。在通过虚拟地址的后12位来进行4096字节的对应！

类型 + 起始地址就能从内存中找到对应的数据！

了解的虚拟内存和物理内存，我们就能知道虚拟内存本质是一种资源可以进行分配。

线程：在进程内部运行，是CPU调度的基本单位。

Linux中是直接套用的进程模块，实现的一种轻量级进程，与主线程共享地址空间！调用成本比多进程低很多！！！

线程 = 线程库里的属性集 + LWP(轻量级进程)

线程的本质是代码块！只使用函数的对应代码，即拿页表的一部分来执行！！！

对于线程创建的接口我们也足够熟悉了！不再赘述

线程的管理是在共享区完成的，编译时，动态链接线程库，映射在地址空间的共享区中。在这个共享区中储存着线程的属性内存块（包含线程单独的栈结构），通过tid我们可以找到线程的所有属性。每个线程都对应一个LWP的pid，这是系统层线程调度的单位！

需要特别注意的是线程互斥的场景，在多线程的场景下，对于全局资源的处理有且只能用一个线程进行操作，否则就会出现意想不到的后果！对于多线程的场景使用互斥锁来对全局资源进行保护，可以通过RAII规则的锁守卫完成只能加减锁！

2 什么是线程池

池化技术是一种广泛应用于系统开发中的优化策略，旨在通过复用资源来提高性能和效率。池化技术的核心思想是预先分配一组资源，并在需要时进行复用，而不是每次都重新创建和销毁资源。
池化技术（Pooling）涉及创建和管理一组预先分配的资源，这些资源可以是进程、线程、数据库连接或对象实例。在池化系统中，当请求到达时，它会从池中获取一个空闲资源，使用完毕后将其归还池中。这种方法避免了频繁的创建和销毁操作，从而显著减少了系统开销。

之前我们实现过进程池：

进程池就是通过预先创建若干个进程与管道，在需要进行任务时，选择一个进程，通过管道发送信息，让其完成工作。不同的进程因为不能共享地址空间，所以想要协同工作就需要进行进程间通信，这里使用管道来实现进程

间的通信。而对于线程池来说，多线程之间是共享地址空间的，所以不需要进行额外的通信，直接调用线程来执行任务就可以！

线程池完成的工作就是在程序运行时，自动创建出若干个线程等待主线程发送任务进行执行，这样不再需要每次再创建线程来完成一个任务，只需要向任务队列中压入任务，线程池就会自动唤醒一个线程来执行任务，执行完就会继续等待任务的到来！

线程池的应用场景：

需要大量的线程来完成任务，且完成任务的时间比较短。 WEB服务器完成网页请求这样的任务，使用线程池技术是非常合适的。因为单个任务小，而任务数量巨大，你可以想象一个热门网站的点击次数。但对于长时间的任务，比如一个Telnet连接请求，线程池的优点就不明显了。因为Telnet会话时间比线程的创建时间大多了。

对性能要求苛刻的应用，比如要求服务器迅速响应客户请求。

接受突发性的大量请求，但不至于使服务器因此产生大量线程的应用。突发性大量客户请求，在没有线程池情况下，将产生大量线程，虽然理论上大部分操作系统线程数目最大值不是问题，短时间内产生大量线程可能使内存到达极限，出现错误

3 线程池工作原理

线程池的关键部分可以分为:

线程容器：用来管理创建的线程，方便统一初始化。
任务队列：用来储存任务消息，需要支持压入与取出的操作。
线程函数：线程都需要执行这个函数模块，在这个函数模块中进行任务的等待和执行。
线程唤醒机制：需要一个线程换取机制，通过条件变量个互斥锁完成对线程的保护与唤醒。
单例模式：线程池不需要创建多个，一个程序只需要一个线程池，通过单例模式进行优化。

这样，通过主线程对线程池中进行的入队列操作就可以传入任务，然后线程池中会自动检测队列中是否有任务，有任务就调用休眠的线程来执行任务。

4 构建线程池

4.1 框架搭建

首先针对线程池的关键组件进行一个框架的构建：
线程池的成员变量：

线程计数 int _thread_num

内部容器 vector _threads

任务队列 queue _tast_queue 这个任务队列会被多线程访问时临界资源！需要所保护

运行判断 bool _isrunning; 判断是否结束

互斥锁 pthread_mutex_t _mtx

条件变量 pthread_cond_t _cond 条件不满足(任务队列无任务)时线程阻塞

休眠线程计数器：_sleep_num 用来判断是否需要唤醒阻塞的线程(判断方法自定义)

为了使用线程方便，我们直接使用之前实现的线程类!

然后我们还需要一下功能函数来支持主线程传入任务，主线程停止工作，线程池读取任务，线程池删除旧任务：
功能函数：

初始化Init：构建线程，并储存在容器中。线程进入线程等待函数 void work()

开始运行Start：遍历进入线程运行， _isrunning = true

停止运行Stop: _isrunning = false! 一切的功能只有true时才可以运行

加入任务Equeue:对临界资源进行操作，先上锁，在插入数据，插入之后可以唤醒休眠的线程来执行任务，如果没有就不需要处理，只有运行状态才可以进行插入！

为了方便进行加减锁的操作，我们可以完成一些线程池内部函数：
内部函数

加锁 LockQueue()

解锁 UnlockQueue()

唤醒线程 WakeUp() : 通过条件变量来唤醒一个线程 --- WakeUpAll：唤醒全部

队列是否为空 IsEmpty()

线程休眠 Sleep() 等待条件变量响应

线程任务 HandlerTask（）: 启动时所有线程都来执行该函数，有任务就执行任务，没有就阻塞等待，需要注意的是，该函数时成员函数，存在隐藏参数this,不满足条件，可以使用bind绑定来解决，有任务就执行任务
主要框架

cpp 复制代码

#pragma once

#include "Thread.hpp"
#include <vector>
#include <queue>
#include <string>
#include "Log.hpp"

using namespace ThreadMouble;
using namespace log_ns;

const int default_num = 5;

// 测试代码
void test()
{
    std::cout << "这是一个测试程序！" << std::endl;
}

template <class T>
class ThreadPool
{
private:
    // 加锁 解锁
    void LockQueue()
    {
        pthread_mutex_lock(&_mtx);
    }
    void UnlockQueue()
    {
        pthread_mutex_unlock(&_mtx);
    }
    // 休眠等待
    void Sleep()
    {
        pthread_cond_wait(&_cond, &_mtx);
    }
    // 唤醒一个线程
    void WakeUp()
    {
        pthread_cond_signal(&_cond);
    }
    // 全部唤醒
    void WakeUpAll()
    {
        pthread_cond_broadcast(&_cond);
    }
    // 队列为空
    bool IsEmpty()
    {
        return _tasks.empty();
    }
    void HandlerTask(std::string &name)
    {
    }
public:
    ThreadPool(int num = default_num) : _thread_num(num), _sleep_num(0), _isrunning(false)
    {
        pthread_mutex_init(&_mtx, nullptr);
        pthread_cond_init(&_cond, nullptr);
    }
public:
    static ThreadPool<T> *GetInstance()
    { 
    }
    // 初始化
    void Init() 
    {
    }
    // 开始运行
    void Start() 
    {
    }
    // 停止运行
    void Stop()
    { 
    }
    // 加入任务
    void Equeue(T &in)
    {
      
    }
    ~ThreadPool()
    {
        pthread_mutex_destroy(&_mtx);
        pthread_cond_destroy(&_cond);
    }

private:
    // 线程容器
    std::vector<Thread> _threads;
    // 任务队列
    std::queue<T> _tasks;
    // 线程数量
    int _thread_num;
    // 休眠数量
    int _sleep_num;
    // 运行判断
    bool _isrunning;
    // 加锁保护队列
    pthread_mutex_t _mtx;
    // 条件变量
    pthread_cond_t _cond;

};

4.3 HandlerTask函数

我们首先先来完成每个线程创建的新线程都会进行的函数：

首先这个函数需要不断的执行，所以使用while(true)使其不断地轮询
然后就是对队列任务的读取，如果队列为空并且线程池还在运行，那么就进入进行等待条件变量唤醒，需要注意的是休眠数需要进行处理
如果队列为空了，并且停止运行了，就直接退出!退出前进行解锁！
如果队列不为空，并且还在运行，那么就从队列中取出一个任务进行执行！

cpp 复制代码

void HandlerTask(std::string &name)
    {
        // 运行任务
        while (true)
        {
            LockQueue();
            // 队列为空并且正在运行
            while (IsEmpty() && _isrunning)
            {
                // 进行阻塞
                _sleep_num++;
                LOG(INFO, "%s sleep begin!\n", name.c_str());
                Sleep();
                LOG(INFO, "%s wakeup!\n", name.c_str());
                _sleep_num--;
            }

            // 如果队列为空 停止运行了
            if (IsEmpty() && !_isrunning)
            {
                // 直接解锁退出
                UnlockQueue();
                // std::cout << name << " stop 退出！" << std::endl;
                LOG(INFO, "%s quit !\n", name.c_str());
                break;
            }

            // 取出一个任务
            T t = _tasks.front();
            _tasks.pop();
            // 解锁
            UnlockQueue();
            // 临界区之外执行任务 
            t();
            // std::cout << name << " " << t.result() << std::endl;
            LOG(DEBUG, "HandlerTask Done, task is : %s\n", t.result().c_str());
        }
    }

完成！

4.3 基础函数

我们先来实现初始化init ，开始运行 start ，停止运行stop，加入任务

初始化：首先就是创建若干个线程，再将创建的线程存入线程容器中。

cpp 复制代码

// 初始化
void Init() 
{
    // 进行绑定
    func_t func = std::bind(&ThreadPool::HandlerTask, this, std::placeholders::_1);
    for (int i = 0; i < _thread_num; i++)
    {
        std::string name = "thread-" + std::to_string(i + 1);
        // std::cout << name << " init!" << std::endl;
        //_threads.emplace_back(name, test); //测试
        _threads.emplace_back(name, func);
        LOG(DEBUG, "construct thread : %s done , init success\n", name.c_str());
    }
}

开始运行：直接遍历一遍进行开始运行即可！每个线程都来执行HandlerTask

cpp 复制代码

// 开始运行
  	  void Start() 
    {
        _isrunning = true;
        for (auto &e : _threads)
        {
            // std::cout << e.getname() << " start!" << std::endl;
            LOG(DEBUG, "start thread %s done\n", e.Name().c_str());
            e.Start();
        }

停止运行：唤醒所有休眠的线程，并将判断符设置为false

cpp 复制代码

   // 停止运行
   void Stop()
   {
       LockQueue();
       // std::cout << "void stop()" << std::endl;
       WakeUpAll();
       _isrunning = false;
       UnlockQueue();
       LOG(INFO, "ThreadPool Stop success\n");
   }

加入任务：这里会对全局变量进行操作，所以先上锁。在线程池还在运行时才可以进程任务的插入，插入后，如果有休眠的线程就唤醒一个休眠的线程来执行任务！

cpp 复制代码

// 加入任务
void Equeue(T &in)
{
    // 临界区操作需要加锁
    LockQueue();
    // 只有线程池运行才可以进行插入
    if (_isrunning)
    {
        _tasks.push(in);
        // std::cout << "加入任务 : " << in.debug() << std::endl;
        LOG(INFO, "push task : %s\n", in.debug().c_str());
        // 唤醒一个线程
        if (_sleep_num > 0)
            WakeUp();
    }

    UnlockQueue();
}

4.4 单例模式改造

单例模式之前的文章有介绍过：设计模式 --- 单例模式

单例模式：一个类只能创建一个对象，即单例模式，该模式可以保证系统中该类只有一个实例，并提供一个访问它的全局访问点，该实例被所有程序模块共享。

接下来我们通过懒汉模式进行优化：

首先我们要做的就是将构造函数私有化，让类外部不能够创建对象，并且封锁赋值重载和拷贝构造！
然后类内需要一个静态类对象指针，并且使用单独一个全局锁进行保护
完成一个获取唯一类对象指针的函数方法getinstance

cpp 复制代码

static ThreadPool<T> *GetInstance()
    {
        if (_tp == nullptr)
        {
            LockGuard lock(&_sig_mtx);
            if (_tp == nullptr)
            {
                LOG(INFO, "create threadpool\n");
                // thread-1 thread-2 thread-3....
                _tp = new ThreadPool();
                _tp->Init();
                _tp->Start();
                
            }
            else
            {
                LOG(INFO, "get threadpool\n");
            }
        }
        return _tp;
    }

cpp 复制代码

// 单例模式
template <class T>
class ThreadPool
{
	//...
    static ThreadPool<T> *_tp;
    static pthread_mutex_t _sig_mtx;
    //...
};
//类外初始化
template <class T>
ThreadPool<T> *ThreadPool<T>::_tp = nullptr;
template <class T>
pthread_mutex_t ThreadPool<T>::_sig_mtx = PTHREAD_MUTEX_INITIALIZER;

这样单例模式就完成了！

4.5 测试运行

cpp 复制代码

#include "ThreadPool.hpp"
#include <iostream>
#include "Task.hpp"
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include "Log.hpp"


int main()
{
    srand(time(nullptr) ^ getpid());
    // ThreadPool<Task> *tp = new ThreadPool<Task>();
    // tp->Init();
    // tp->Start();
    ThreadPool<Task> *tp = ThreadPool<Task>::GetInstance();
    int cnt = 5;
    while (--cnt)
    {
        int num1 = rand() % 10;
        usleep(1000);
        int num2 = rand() % 10;
        Task t(num1, num2);
        tp->Equeue(t);
        LOG(INFO , "Equeue a task , %s\n" , t.debug().c_str());
        sleep(1);
    }
    tp->Stop();
    LOG(INFO , "ThreadPool stop! \n");
    return 0;
}

我们来进行测试：

很好的完成测试代码！！！

5 总结

线程的学习就告一段落，接下来我将会完成一个高并发内存池项目，来巩固C++的知识，并为简历增添一笔重要颜色！完成项目之后开启全新篇章 --- 计算机网络，欢迎大家支持！！！

接下来还会持续更新算法相关内容，欢迎大家支持！！！