【C++详解】红黑树规则讲解与模拟实现(内附红黑树插入操作思维导图)

文章目录


一、红⿊树的概念

红⿊树是⼀棵⼆叉搜索树,他的每个结点增加⼀个存储位来表⽰结点的颜⾊,可以是红⾊或者⿊⾊。通过对任何⼀条从根到叶⼦的路径上各个结点的颜⾊进⾏约束,红⿊树确保没有⼀条路径会⽐其他路径⻓出2倍,因⽽是接近平衡的。而我们之前介绍的AVL树是严格平衡的。

红⿊树的规则

  1. 每个结点不是红⾊就是⿊⾊。
  2. 根结点是⿊⾊的。
  3. 如果⼀个结点是红⾊的,则它的两个孩⼦结点必须是⿊⾊的,也就是说任意⼀条路径不会有连续的红⾊结点。
  4. 对于任意⼀个结点,从该结点到其所有NULL结点的简单路径上,均包含相同数量的⿊⾊结点。
    规则3不满足可能会造成最长路径超过最短路径的二倍。
    示意图:


红⿊树如何确保最长路径不超过最短路径的2倍

  • 由规则4可知,从根到NULL结点的每条路径都有相同数量的⿊⾊结点,所以极端场景下,最短路径就就是全是⿊⾊结点的路径,假设最短路径⻓度为bh(black height)。
  • 由规则2和规则3可知,任意⼀条路径不会有连续的红⾊结点,所以极端场景下,最⻓的路径就是⼀⿊⼀红间隔组成,那么最⻓路径的⻓度为2*bh。
  • 综合红⿊树的4点规则⽽⾔,理论上的全⿊最短路径和⼀⿊⼀红的最⻓路径并不是在每棵红⿊树都存在的。假设任意⼀条从根到NULL结点路径的⻓度为x,那么bh <= x <= 2*bh。

注意:计算任何一条路径都要从根结点走到空结点。

红⿊树的效率

假设N是红⿊树树中结点数量,h最短路径的⻓度,2*h就是最长路径的⻓度,那么2^h − 1 <= N < 2^2∗h − 1(因为红黑树最短路径那一层是满二叉树), 由此推出h ≈ logN,也就是意味着红⿊树增删查改最坏也就是⾛最⻓路径2 ∗ logN,那么时间复杂度还是O(logN)。

红⿊树的表达相对AVL树要抽象⼀些,AVL树通过⾼度差直观的控制了平衡。红⿊树通过4条规则的颜⾊约束,间接的实现了近似平衡,他们效率都是同⼀档次,但是相对⽽⾔,插⼊相同数量的结点,红⿊树的旋转次数是更少的,因为他对平衡的控制没那么严格。

二、红⿊树的实现

红⿊树的结构

这里的enum是枚举类型。

cpp 复制代码
enum colour
{
	BLACK,
	RED
};

template<class K, class V>
struct RBTNode
{
	pair<K, V> _kv;
	RBTNode* _left;
	RBTNodee* _right;
	RBTNode* _parent;
	colour _col;

	RBTNode(const pair<K, V>& kv)
		:_kv(kv)
		,_left(nullptr)
		._right(nullptr)
		,_parent(nullptr)
		()
};

template<class K, class V>
class RBTree
{
	typedef RBTNode<K, V> Node;
public:

private:
	Node* _root == nullptr;
};

红⿊树的插⼊

红⿊树插⼊⼀个值的大概过程

  1. 插⼊⼀个值按⼆叉搜索树规则进⾏插⼊,插⼊后我们需要观察是否符合红⿊树的4条规则。
  2. 如果是空树插⼊,新增结点是⿊⾊结点。如果是⾮空树插⼊,新增结点必须是红⾊结点,因为⾮空树插⼊,新增⿊⾊结点就破坏了规则4,规则4是很难维护的。
  3. ⾮空树插⼊后,新增结点为红⾊结点,如果⽗亲结点是⿊⾊的,则没有违反任何规则,插⼊结束。
  4. ⾮空树插⼊后,新增结点必须红⾊结点,如果⽗亲结点是红⾊的,则违反规则3。进⼀步分析,c是红⾊,p为红,g必为⿊,这三个颜⾊都固定了,关键的变化看u的情况,需要根据u分为以下⼏种情况分别处理。
  5. 原则就是尽量让每条路径的黑色结点个数保持不变。

说明:下图中假设我们把新增结点标识为c(cur),c的⽗亲标识为p(parent),p的⽗亲标识为g(grandfather),p的兄弟标识为u(uncle)。

情况1:变色

前言:c存在且为红。p存在并且也为红,如果p为黑则插入操作在变色之前就结束了。g存在,因为p为红不是根节点,所以p的上面一定存在g,并且g为黑,因为如果g为红那么g和p就是连续的红结点,不符合要求,我们默认在插入之前红黑树结构是满足要求的。所以在这种情况下c、p、g结点都存在且颜色固定,而唯一一个变数就是结点u的颜色和存在与否,下面对情况u的讨论都是围绕结点u展开的。

以下三种情况本质都是要把p变黑,要么直接变色,要么旋转+变色。
c为红,p为红,g为⿊,u存在且为红,则将p和u变⿊,g变红(保持每条路径黑色结点个数不变)。在把g当做新的c,继续往上更新。

分析:因为p和u都是红⾊,g是⿊⾊,把p和u变⿊,左边⼦树路径各增加⼀个⿊⾊结点,g再变红,相当于保持g所在⼦树的⿊⾊结点的数量不变,同时解决了c和p连续红⾊结点的问题。如果这时候(cur = grandparent之前)g的⽗亲还是红⾊,那么就需要继续往上更新,把g当成c,这幅图的30结点当成p,18结点当成g继续向上调整;如果g的⽗亲是⿊⾊,则处理结束了;如果g就是整棵树的根,再把g变回⿊⾊,也处理结束。

情况1只变⾊,不旋转。所以⽆论c是p的左还是右,p是g的左还是右,都是上⾯的变⾊处理⽅式。

跟AVL树类似,上图只展⽰了⼀种具体情况,但是实际中需要这样处理的有很多种情况。

下面的示意图将以上类似的处理进⾏了抽象表达,d/e/f代表每条路径拥有hb个⿊⾊结点的⼦树,a/b代表每条路径拥有hb-1个⿊⾊结点的根为红的⼦树,hb>=0。但是不论情况有多少种,多么复杂,处理⽅式⼀样的,变⾊再继续往上处理即可。

情况2:单旋+变⾊

情况2和情况3里u存在且为黑的情况都是通过情况1变来的,并且情况2和情况3执行完毕后不需要再向上更新了。

c为红,p为红,g为⿊,u不存在或者u存在且为⿊,u不存在,则c⼀定是新增结点(因为若不是新增那么c所在子树至少有一个黑结点,而g的另一颗子树因为u不存在肯定没有黑色结点,所以使得路径里黑色结点数目不相等了),u存在且为⿊,则c⼀定不是新增,(若c为新增则c所在子树没有黑色结点,分析和前一条性质相反)c之前是⿊⾊的,是在c的⼦树中插⼊,符合情况1,变⾊将c从⿊⾊变成红⾊,更新上来的。

分析:p必须变⿊,才能解决,连续红⾊结点的问题,u不存在或者是⿊⾊的,这⾥单纯的变⾊⽆法解决问题,需要旋转+变⾊。

如果p是g的左,c是p的左,那么以g为旋转点进⾏右单旋,再把p变⿊,g变红即可。p变成课这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为p的⽗亲是⿊⾊还是红⾊或者空都不违反规则。

如果p是g的右,c是p的右,那么以g为旋转点进⾏左单旋,再把p变⿊,g变红即可。p变成这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为p的⽗亲是⿊⾊还是红⾊或者空都不违反规则。
u不存在,c为新增的示意图:

u存在且为⿊,c不为新增的示意图:

具体情况图:

情况3:双旋+变⾊

该情况的触发条件和解决方法和情况2类似,只不过情况2是一边大只用单旋,该情况是一边大的一边小,需要双旋。

如果p是g的左,c是p的右,那么先以p为旋转点进⾏左单旋,再以g为旋转点进⾏右单旋,再把c变⿊,g变红即可。c变成这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的⽗亲是⿊⾊还是红⾊或者空都不违反规则。

如果p是g的右,c是p的左,那么先以p为旋转点进⾏右单旋,再以g为旋转点进⾏左单旋,再把c变⿊,g变红即可。c变成这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的⽗亲是⿊⾊还是红⾊或者空都不违反规则。
u不存在,c为新增的示意图:

u存在且为⿊,c不为新增的示意图:

具体情况图:

思维导图

插入代码实现

cpp 复制代码
bool Insert(const pair<K, V> kv)
{
	if (_root == nullptr)
	{
		_root = new Node(kv);
		_root->_col = BLACK; //根结点为黑
		return true;
	}
	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else
		{
			return false;
		}
	}
	cur = new Node(kv);
	cur->_col = RED;   //插入结点默认为红
	if (kv.first < parent->_kv.first)
		parent->_left = cur;
	else
		parent->_right = cur;
	cur->_parent = parent;

	while (parent && parent->_col == RED) //更新到根结点和parent为黑出循环停止更新
	{
		Node* grandparent = parent->_parent;
		if (parent == grandparent->_left)  //p在左,u在右
		{
			Node* uncle = grandparent->_right;
			if (uncle && uncle->_col == RED)     //u存在且为红
			{
				parent->_col = uncle->_col = BLACK;
				grandparent->_col = RED;
				//继续向上调整
				cur = grandparent;
				parent = cur->_parent;
			}
			else                                //u存在且为黑或不存在
			{
				if (cur == parent->_left) //都左边小,右单旋
				{
					//      g
					//    p   u
					//  c
					RotateR(grandparent);
					grandparent->_col = RED;
					parent->_col = BLACK;
				}
				else                     //左边小的右边大,左右双旋
				{
					//      g
					//    p   u
					//     c
					RotateL(parent);
					RotateR(grandparent);
					grandparent->_col = RED;
					cur->_col = BLACK; //cur被推上来做根
				}
				break; //情况2、3执行完后便更新完毕
			}
		}
		else  //p在右,u在左
		{
			Node* uncle = grandparent->_left;
			if (uncle && uncle->_col == RED)     //u存在且为红
			{
				parent->_col = uncle->_col = BLACK;
				grandparent->_col = RED;
				//继续向上调整
				cur = grandparent;
				parent = cur->_parent;
			}
			else                                //u存在且为黑或不存在
			{
				if (cur == parent->_right) //都右边小,左单旋
				{
					//      g
					//    u   p
					//         c
					RotateL(grandparent);
					grandparent->_col = RED;
					parent->_col = BLACK;
				}
				else                     //右边大的左边小,右左双旋
				{
					//      g
					//    u   p
					//       c
					RotateR(parent);
					RotateL(grandparent);
					grandparent->_col = RED;
					cur->_col = BLACK; //cur被推上来做根
				}
				break;
			}
		}
	}
	_root->_col = BLACK;  //情况1cur更新到根节点需要把根结点变黑
	return true;
}

查找

cpp 复制代码
Node* Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < key)
		{
			cur = cur->_right;
		}
		else if (cur->_kv.first > key)
		{
			cur = cur->_left;
		}
		else
		{
			return cur;
		}
	}
	return nullptr;
}

红⿊树的验证

这⾥获取最⻓路径和最短路径,检查最⻓路径不超过最短路径的2倍是不可⾏的,因为就算满⾜这个条件,红⿊树也可能颜⾊不满⾜规则,当前暂时没出问题,后续继续插⼊还是会出问题的。所以我们还是去检查4点规则,满⾜这4点规则,⼀定能保证最⻓路径不超过最短路径的2倍。

  1. 规则1枚举颜⾊类型,天然实现保证了颜⾊不是⿊⾊就是红⾊。
  2. 规则2直接检查根即可。
  3. 规则3用递归前序遍历检查,遇到红⾊结点查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来红⾊结点检查⽗亲的颜⾊就⽅便多了。
  4. 规则4前序遍历,遍历过程中⽤形参记录跟到当前结点的blackNum(⿊⾊结点数量),前序遍历遇到⿊⾊结点就++blackNum,⾛到空就计算出了⼀条路径的⿊⾊结点数量。再用任意⼀条路径⿊⾊结点数量作为参考值,依次⽐较即可。
    思路:根到当前结点的黑色结点个数=根到父亲结点的黑色结点个数 + 当前结点的黑色结点个数(当前结点为黑该值为1,为红则该值为0)。把这个记录值放在递归函数的参数里。
cpp 复制代码
bool IsBalance()
{
	if (_root == nullptr)
		return true;
	if (_root->_col == RED)
		return false;
	// 参考值
	int refNum = 0;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_col == BLACK)
		{
			++refNum;
		}
		cur = cur->_left;
	}
	return Check(_root, 0, refNum);
}

//前序递归遍历
bool Check(Node* root, int blackNum, const int refNum)
{
	if (root == nullptr)
	{
		// 前序遍历⾛到空时,意味着⼀条路径⾛完了
		//cout << blackNum << endl;
		if (refNum != blackNum)
		{
			cout << "存在黑色结点的数量不相等的路径" << endl;
			return false;
		}
		return true;
	}
	// 检查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲就⽅便多了
	if (root->_col == RED && root->_parent  && root->_parent->_col == RED)
	{
		cout << root->_kv.first << "存在连续的红⾊结点" << endl;
		return false;
	}
	if (root->_col == BLACK)
	{
		blackNum++;
	}
	return Check(root->_left, blackNum, refNum)
		&& Check(root->_right, blackNum, refNum);
}

三、源码

RBTree.h:

cpp 复制代码
#pragma once
using namespace std;
#include <iostream>
#include <vector>
#include <assert.h>

enum colour
{
	BLACK,
	RED
};

template<class K, class V>
struct RBTNode
{
	pair<K, V> _kv;
	RBTNode* _left;
	RBTNode* _right;
	RBTNode* _parent;
	colour _col;

	RBTNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
	{
	}
};

template<class K, class V>
class RBTree
{
	typedef RBTNode<K, V> Node;
public:
	bool Insert(const pair<K, V> kv)
	{
		if (_root == nullptr)
		{
			_root = new Node(kv);
			_root->_col = BLACK; //根结点为黑
			return true;
		}
		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else
			{
				return false;
			}
		}
		cur = new Node(kv);
		cur->_col = RED;   //插入结点默认为红
		if (kv.first < parent->_kv.first)
			parent->_left = cur;
		else
			parent->_right = cur;
		cur->_parent = parent;

		while (parent && parent->_col == RED) //更新到根结点和parent为黑出循环停止更新
		{
			Node* grandparent = parent->_parent;
			if (parent == grandparent->_left)  //p在左,u在右
			{
				Node* uncle = grandparent->_right;
				if (uncle && uncle->_col == RED)     //u存在且为红
				{
					parent->_col = uncle->_col = BLACK;
					grandparent->_col = RED;
					//继续向上调整
					cur = grandparent;
					parent = cur->_parent;
				}
				else                                //u存在且为黑或不存在
				{
					if (cur == parent->_left) //都左边小,右单旋
					{
						//      g
						//    p   u
						//  c
						RotateR(grandparent);
						grandparent->_col = RED;
						parent->_col = BLACK;
					}
					else                     //左边小的右边大,左右双旋
					{
						//      g
						//    p   u
						//     c
						RotateL(parent);
						RotateR(grandparent);
						grandparent->_col = RED;
						cur->_col = BLACK; //cur被推上来做根
					}
					break; //情况2、3执行完后便更新完毕
				}
			}
			else  //p在右,u在左
			{
				Node* uncle = grandparent->_left;
				if (uncle && uncle->_col == RED)     //u存在且为红
				{
					parent->_col = uncle->_col = BLACK;
					grandparent->_col = RED;
					//继续向上调整
					cur = grandparent;
					parent = cur->_parent;
				}
				else                                //u存在且为黑或不存在
				{
					if (cur == parent->_right) //都右边小,左单旋
					{
						//      g
						//    u   p
						//         c
						RotateL(grandparent);
						grandparent->_col = RED;
						parent->_col = BLACK;
					}
					else                     //右边大的左边小,右左双旋
					{
						//      g
						//    u   p
						//       c
						RotateR(parent);
						RotateL(grandparent);
						grandparent->_col = RED;
						cur->_col = BLACK; //cur被推上来做根
					}
					break;
				}
			}
		}
		_root->_col = BLACK;  //情况1cur更新到根节点需要把根结点变黑
		return true;
	}

	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < key)
			{
				cur = cur->_right;
			}
			else if (cur->_kv.first > key)
			{
				cur = cur->_left;
			}
			else
			{
				return cur;
			}
		}
		return nullptr;
	}

	void InOrder()
	{
		_InOrder(_root);
		cout << endl;
	}

	//前序递归遍历
	bool Check(Node* root, int blackNum, const int refNum)
	{
		if (root == nullptr)
		{
			// 前序遍历⾛到空时,意味着⼀条路径⾛完了
			//cout << blackNum << endl;
			if (refNum != blackNum)
			{
				cout << "存在黑色结点的数量不相等的路径" << endl;
				return false;
			}
			return true;
		}
		// 检查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲就⽅便多了
		if (root->_col == RED && root->_parent && root->_parent->_col == RED)
		{
			cout << root->_kv.first << "存在连续的红⾊结点" << endl;
			return false;
		}
		if (root->_col == BLACK)
		{
			blackNum++;
		}
		return Check(root->_left, blackNum, refNum)
			&& Check(root->_right, blackNum, refNum);
	}

	bool IsBalance()
	{
		if (_root == nullptr)
			return true;
		if (_root->_col == RED)
			return false;
		// 参考值
		int refNum = 0;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_col == BLACK)
			{
				++refNum;
			}
			cur = cur->_left;
		}
		return Check(_root, 0, refNum);
	}

	void _InOrder(Node* root)
	{
		if (root == nullptr)
			return;
		_InOrder(root->_left);
		cout << root->_kv.first << " ";
		_InOrder(root->_right);
	}

	void RotateR(Node* parent)
	{
		Node* subL = parent->_left;
		Node* subLR = subL->_right;
		//分配孩子
		subL->_right = parent;
		parent->_left = subLR;
		//调整subLR的父亲
		if (subLR)
			subLR->_parent = parent;
		Node* parentParent = parent->_parent; //提前保存
		//调整parent的父亲
		parent->_parent = subL;
		//调整subL的父亲和parentParent的孩子
		if (parent == _root)
		{
			_root = subL;
			subL->_parent = nullptr;
		}
		else
		{
			subL->_parent = parentParent;
			if (parent == parentParent->_left)
				parentParent->_left = subL;
			else
				parentParent->_right = subL;
		}
	}

	void RotateL(Node* parent)
	{
		Node* subR = parent->_right;
		Node* subRL = subR->_left;
		//分配孩子
		subR->_left = parent;
		parent->_right = subRL;
		//调整subLR的父亲
		if (subRL)
			subRL->_parent = parent;
		Node* parentParent = parent->_parent; //提前保存
		//调整parent的父亲
		parent->_parent = subR;
		//调整subL的父亲和parentParent的孩子
		if (parent == _root)
		{
			_root = subR;
			subR->_parent = nullptr;
		}
		else
		{
			subR->_parent = parentParent;
			if (parent == parentParent->_left)
				parentParent->_left = subR;
			else
				parentParent->_right = subR;
		}
	}

private:
	Node* _root = nullptr;
};

test.c:

cpp 复制代码
void TestRBTree1()
{
	RBTree<int, int> t;
	// 常规的测试⽤例
	//int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
	// 特殊的带有双旋场景的测试⽤例
	int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
	for (auto e : a)
	{
		t.Insert({ e, e });
	}
	t.InOrder();
	cout << t.IsBalance() << endl;
}

// 插⼊⼀堆随机值,测试平衡,顺便测试⼀下⾼度和性能等
void TestRBTree2()
{
	const int N = 100000000;
	vector<int> v;
	v.reserve(N);
	//srand(time(0));
	for (size_t i = 0; i < N; i++)
	{
		v.push_back(rand() + i);
	}
	RBTree<int, int> t;
	int i = 0;
	for (auto e : v)
	{
		t.Insert(make_pair(e, e));
		//cout << 'e' << ':' << e << " IsBalance: " << t.IsBalance() << " i: " << ++i << endl;
	}
	cout << t.IsBalance() << endl;

	//size_t begin1 = clock();
	// 确定在的值
	//for (auto e : v)
	//{
	//	t.Find(e);
	//}
	//// 随机值
	////for (size_t i = 0; i < N; i++)
	////{
	////	t.Find((rand() + i));
	////}
	//size_t end1 = clock();
	//cout << "Find:" << end1 - begin1 << endl;
}


int main()
{
	//TestRBTree1();
	TestRBTree2();
	return 0;
}

以上就是小编分享的全部内容了,如果觉得不错还请留下免费的关注和收藏
如果有建议欢迎通过评论区或私信留言,感谢您的大力支持。
一键三连好运连连哦~~