tigase源码学习杂记-IO处理的线程模型

前言

tigase是一个高性能的服务器，其实个人认为作为即时通讯的服务器，高性能主要体现在他对IO复用，和多线程的使用上，今天来学习一下他的IO的线程处理模型的源码，并记录一下他优秀的设计。

概述

tigase是使用的NIO作为自己的IO模型。IOService是实现了Callable接口的并持有SocketChannel对象的一个抽象的IO封装对象。

tigase的IO处理线程模型的核心类是 SocketThread,此类提供了两个核心的静态方法：addSocketService(IOService<?> s) 和 removeSocketService(IOService<Object> s) 分别是表示把IOService对象添加进线程模型中和把IOService对象移除线程模型中。其他IO监听器类监听到IO的xmppStreamOpened()发生之后，调用addSocketService(IOService<?> s)方法将数据添加到SocketThread之后，就开始了整个多线程处理整个IO复用的流程。

IO处理流程设计

tiagase IO处理流程图

ConnectionOpenThread作为整个tigase的IO监听连接的线程，tigase服务启动之后就会启动ConnectionOpenThread。启动完ConnectionOpenThread流程如下：

ConnectionOpenThread首先会初始化内部的Selector用于对客户端的连接的监听。（当然ConnectionOpenThread也会做一些限流的控制，超过连接数就拒绝新连接等）对应图中1步
接着ConnectionOpenThread就会循环监听就绪的SelectKey,拿到SocketChannel传递给ConnectionOpenListener。对应图中2、3、4步
ConnectionOpenListener监听器就会创建IOService对象，并设置一些参数，包括SSL容器，和其他的一些监听器。对应图中5、6步
ConnectionManager(连接管理器)启动IOService对象，添加连接超时需要执行的Task，并将IOService对象通过SocketThread.addSocketService(IOService<?> s)添加到IO复用的线程模型中，自此进入了IO处理的线程的逻辑。对应图中7、8、9步
SocketThread.addSocketService(IOService<?> s)通过哈希和取模的算法，将数据负载均衡到不同的SocketThread的waitting的跳表集合中进行数据的缓冲。SocketThread循环从waitting跳表集合中拿到IOService并根据读写事件类型，将IOService注册到SocketThread自身的Selector对象上。对应图中10步
SocketThread循序监听Selector就绪的SelectKey,并拿到IOService对象，并将IOService添加到forCompletion跳表集合中进行缓冲。对应图中11步
SocketThread循环从forCompletion跳表集合中拿到IOService对象，丢到completionService线程池进行执行IOService的call()方法。对应图中12步
ResultsListener 结果监听器线程循环监听completionService执行结束的IOService对象的状态，如果IOService状态是isConnected就继续调用SocketThread.addSocketService(IOService<?> s)添加到SocketThread进行重复调用每个IOService自身的call()方法。自此整个IO的循环处理流程基本结束。对应图中13步

SocketThread的线程模型

tigase的线程模型和Netty的主从React的模式有点像，ConnectionOpenThread主要用来处理客户端的连接建立，建立之后创建将SocketChannel封装到IOService抽象对象中，通过IOService.hashCode() % SocketThread.length 算法负载均衡到不同的ScoketThread中（因为是跟IOService计算的hash,保证相同的IO对象会添加到相同的线程中去），通过SocketChannel的一列缓冲操作，将就绪的IOServices丢到CompletionService线程池中去，线程池来执行IOService.call()方法对数据进行读写的各种操作。call()中加了读写锁，这里效率略低于Netty的设计，Netty是一个线程基于责任链的形式一个线程执行到底的无锁设计，这里ResultsListener可以将IOService再次丢入线程池中供不同的线程继续调用。

SocketThread类数据结构设计源码分析

数据结构

java 复制代码

class SocketThread implements Runnable{
    //线程池
    private static CompletionService<IOService<?>> completionService = null;
	//读线程数组
	private static SocketThread[] socketReadThread = null;
	//写线程数组
	private static SocketThread[] socketWriteThread = null;
}

SocketThread线程通过持有两个static类型的读写线程组和CompletionService的线程池组成他的独特的线程模型，通过读写线程分组提高代码的效率，并更好地体现了设计的单一职责。CompletionService的线程池主要的作用就是解耦执行和结果的获取。采用static的类变量，就只有初始化一次。在类加载完成之后，线程处理模型就初始化好了。

初始化相关代码

java 复制代码

class SocketThread implements Runnable{ 
    //默认每个核心的线程数
    public static final int DEF_MAX_THREADS_PER_CPU = 8;
    //获取系统的核心数
    private static int cpus = Runtime.getRuntime().availableProcessors();
	static {
		if (socketReadThread == null) {
			//根据CPU核数计算默认线程数
			int nThreads = (cpus * DEF_MAX_THREADS_PER_CPU) / 2 + 1;

			executor = new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS,
											  new LinkedBlockingQueue<Runnable>());
			completionService = new ExecutorCompletionService<IOService<?>>(executor);
			socketReadThread = new SocketThread[nThreads];
			socketWriteThread = new SocketThread[nThreads];

			//读线程初始化
			for (int i = 0; i < socketReadThread.length; i++) {
				socketReadThread[i] = new SocketThread("socketReadThread-" + i);
				socketReadThread[i].reading = true;

				Thread thrd = new Thread(socketReadThread[i]);

				thrd.setName("socketReadThread-" + i);
				thrd.start();
			}

			...

			//写线程初始化
			for (int i = 0; i < socketWriteThread.length; i++) {
				socketWriteThread[i] = new SocketThread("socketWriteThread-" + i);
				socketWriteThread[i].writing = true;

				Thread thrd = new Thread(socketWriteThread[i]);

				thrd.setName("socketWriteThread-" + i);
				thrd.start();
			}

			...
		}   
	}
}

线程模型初始化很简单，就是通过一个static代码块，初始化相关的读写线程组和处理IOService的call()方法调用的线程池。这里稍微核心一点的我想说可能就是计算线程池的公式，这里对tiagse的计算公式进行化简可得 nThread = CPU 核数 * 4 + 1， 而对比《java并发编程实战》一书的第八章的线程池的最优计算公式：线程数 = CPU 核数 * CPU利用率 * (1 + 等待时间/计算时间), 朝着tigase公式的形式化简一下可得：线程数 = CPU 核数 * CPU利用率 + CPU 核数 *(CPU利用率*等待时间/计算时间))， 由于tigase是IO密集型系统，所以我大胆假设 CPU 核数 * CPU利用率 ≈1, 所以以上两个公式可得出：CPU利用率*等待时间/计算时间 = 4. 当然这这只是个人的一些假设，用于复习一下线程池计算公式。实际数据肯定是tigase经过大量测试优化之后的最优数据。

SocketThread成员变量数据结构设计源码

java 复制代码

class SocketThread implements Runnable{
	//selector对象
	private Selector clientsSel = null;

	// 控制selector为空的一个计数器
	private int empty_selections = 0;
	
	//"待完成"的IOService的缓冲跳表集合
	private ConcurrentSkipListSet<IOService<?>> forCompletion = new ConcurrentSkipListSet<IOService<?>>(
			new IOServiceComparator());
	//读状态
	private boolean reading = false;
	//写状态
	private boolean writing = false;
	//停止状态
	private boolean stopping = false;
	//等待的IOService的缓冲跳表集合
	private ConcurrentSkipListSet<IOService<?>> waiting = new ConcurrentSkipListSet<IOService<?>>(
			new IOServiceComparator());
}

clientsSel对象: 用于监听对象的就绪状态。
empty_selections：作为一个计数器，作用是统计 "Selector中就绪的Key为0 且 waiting跳表中的IOService为0" 的个数，当个数大于默认的10次，就重新创建Selector，代码的注释写的是解决两个java的BUG，这里就不做展开。
forCompletion：待完成的IOService的跳表缓冲集合
reading：标记SocketThread是否是处理IO读的线程
writing:：标记SocketThread是否是处理IO写的线程
stopping：标记SocketThread线程是否是已经停止
waiting：等待的IOService的跳表缓冲集合

核心的addSocketService、 removeSocketService方法源码

java 复制代码

   /**
	 * 核心方法添加IOService
	 * @param s
	 */
	public static void addSocketService(IOService<?> s) {
		//设置IOService已就绪
		s.setSocketServiceReady(true);
		// Due to a delayed SelectionKey cancelling deregistering
		// nature this distribution doesn't work well, it leads to
		// dead-lock. Let's make sure the service is always processed
		// by the same thread thus the same Selector.
		// socketReadThread[incrementAndGet()].addSocketServicePriv(s);
		//如果IOService是等待读的状态，那个根据 % 算法均衡到不同的线程中去
		if (s.waitingToRead()) {
			socketReadThread[s.hashCode() % socketReadThread.length].addSocketServicePriv(s);
		}
		//如果是待发送的IOService则根据 % 算法负载到写线程中去
		if (s.waitingToSend()) {
			socketWriteThread[s.hashCode() % socketWriteThread.length].addSocketServicePriv(s);
		}
	}

	/**
	 * 核心移除IOService方法
	 * @param s
	 */
	public static void removeSocketService(IOService<Object> s) {
		//设置就绪状态false
		s.setSocketServiceReady(false);
		//读写线程中都移除这个IOService对象
		socketReadThread[s.hashCode() % socketReadThread.length].removeSocketServicePriv(s);
		socketWriteThread[s.hashCode() % socketWriteThread.length].removeSocketServicePriv(s);
	}

两个都是静态方法，其核心原理就是用过hash 和取模算法分配IOService到SocketThread数组中的不同SocketThread线程中去。

SocketThread的run方法分析

java 复制代码

public void run() {
		while (!stopping) {
			try {
				clientsSel.select();
				Set<SelectionKey> selected = clientsSel.selectedKeys();
				int selectedKeys = selected.size();
				//就绪的Key为0 且 等待的IOService为0
				if ((selectedKeys == 0) && (waiting.size() == 0)) {
					//重新创建Selector条件
					if ((++empty_selections) > MAX_EMPTY_SELECTIONS) {
						recreateSelector();
					}
				} else {
					empty_selections = 0;
					if (selectedKeys > 0) {
						//遍历就绪的Key
						for (SelectionKey sk : selected) {
							//从就绪的Key中拿到IOService对象
							IOService s = (IOService) sk.attachment();
							try {
							    ...
								sk.cancel();
								//添加到"待完成" 跳表中
								forCompletion.add(s);
							} catch (CancelledKeyException e) {
							     //异常就强制停止IOService
								 s.forceStop();
							}
						}
					}
					clientsSel.selectNow();
				}
				//将waiting跳表中的IOService分类注册到当前SocketThread的Selector上
				addAllWaiting();
				IOService serv = null;
				//先是从waiting 跳表注册到到当前forCompletion，然后再从
				//forCompletion跳表拿到最小的一个不为空，
                //就丢到completionService中执行，执行完只需要take()就能拿到执行完的对象
				while ((serv = forCompletion.pollFirst()) != null) {
					completionService.submit(serv);
				}
			} catch (Exception e) {
				  recreateSelector();
			}
		}
	}

SocketThread本身是一个线程，其核心的方法和流程就在run()方法里面，以上代码是我精简之后留下的核心代码，具体的逻辑就是循环将waiting跳表集合中的IOServie注册到Selector上，并监听就绪的IOService，将其添加到forCompletion跳表集合中，然后从forCompletion中挨个取出，提交到completionService线程池中。供线程池调用IOService核心的call()方法进行数据的读写。

小结

tiagse的IO线程处理模型充分利用多线程和单一职责的设计，ConnectionOpenThread负载客户端连接的建立、SocketThread线程组负责监听就绪的IO对象，以及读写IO的分类、缓冲等，CompletionService线程池负责执行IOService的call方法（主要是处理IO的读写操作），以及解耦执行和执行结果的获取操作。ResultsListener线程负责循环利用没有关闭的IOService对象。合理的线程模型设计，更有利于提高系统的效率。