高阶数据结构之红黑树详解

1.红黑树的概念

红黑树是一种每个节点都带有颜色属性(红色或黑色)的二叉查找树,通过对任何一条从根到叶子的路径上各个节点的着色限制,确保没有一条路径会比其他路径长出两倍,因此接近平衡。

1.1 红⿊树的规则

  1. 每个结点不是红⾊就是⿊⾊
  2. 根结点是⿊⾊的
  3. 如果⼀个结点是红⾊的,则它的两个孩⼦结点必须是⿊⾊的,也就是说任意⼀条路径不会有连续的红⾊结点。
  4. 对于任意⼀个结点,从该结点到其所有NULL结点的简单路径上,均包含相同数量的⿊⾊结点

说明:《算法导论》等书籍上补充了⼀条每个叶⼦结点(NIL)都是⿊⾊的规则。他这⾥所指的叶⼦结点不是传统的意义上的叶⼦结点,⽽是我们说的空结点,有些书籍上也把NIL叫做外部结点。NIL是为了⽅便准确的标识出所有路径,《算法导论》在后续讲解实现的细节中也忽略了NIL结点,所以我们知道⼀下这个概念即可。
下面给出四个红黑树:


1.2红⿊树确保最⻓路径不超过最短路径的2倍方式

  • 由规则4可知,从根到NULL结点的每条路径都有相同数量的⿊⾊结点,所以极端场景下,最短路径就就是全是⿊⾊结点的路径,假设最短路径⻓度为bh(black height)。
  • 由规则2和规则3可知,任意⼀条路径不会有连续的红⾊结点,所以极端场景下,最⻓的路径就是⼀⿊⼀红间隔组成,那么最⻓路径的⻓度为2*bh。
  • 综合红⿊树的4点规则⽽⾔,理论上的全⿊最短路径和⼀⿊⼀红的最⻓路径并不是在每棵红⿊树都存在的。假设任意⼀条从根到NULL结点路径的⻓度为x,那么bh <= h <= 2*bh。

1.3 红⿊树的效率:

  • 假设N是红⿊树树中结点数量,h最短路径的⻓度,那么2^h -1<=N<2^2h -1, 由此推出h≈logN,也就是意味着红⿊树增删查改最坏也就是⾛最⻓路径 2*logN,那么时间复杂度还是 O(logN)。

  • 红⿊树的表达相对AVL树要抽象⼀些,AVL树通过⾼度差直观的控制了平衡。红⿊树通过4条规则的颜⾊约束,间接的实现了近似平衡,他们效率都是同⼀档次,但是相对⽽⾔,插⼊相同数量的结点,红⿊树的旋转次数是更少的,因为他对平衡的控制没那么严格。

2.红黑树的实现

2.1红黑树的结构

cpp 复制代码
//枚举值表示颜色
enum Color
{
	RED,
	BLACK
};

//默认按key/value结构实现
template<class K,class V>
struct RBTreeNode
{
	// 这⾥更新控制平衡也要加⼊parent指针
	pair<K, V> _kv;
	RBTreeNode<K, V>* _left;
	RBTreeNode<K, V>* _right;
	RBTreeNode<K, V>* _parent;
	Colour _col;
	RBTreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
	{
	}
};

template<class K, class V>
class RBTree
{
	typedef RBTreeNode<K, V> Node;
public:

private:
	Node* _root = nullptr;
};

2.2 红⿊树的插⼊

红⿊树树插⼊⼀个值的⼤概过程

  1. 插⼊⼀个值按⼆叉搜索树规则进⾏插⼊,插⼊后我们只需要观察是否符合红⿊树的4条规则。
  2. 如果是空树插⼊,新增结点是⿊⾊结点。如果是⾮空树插⼊,新增结点必须红⾊结点,因为⾮空树插⼊,新增⿊⾊结点就破坏了规则4,规则4是很难维护的。
  3. ⾮空树插⼊后,新增结点必须红⾊结点,如果⽗亲结点是⿊⾊的,则没有违反任何规则,插⼊结束
  4. ⾮空树插⼊后,新增结点必须红⾊结点,如果⽗亲结点是红⾊的,则违反规则3。进⼀步分析,c是红⾊,p为红,g必为⿊,这三个颜⾊都固定了,关键的变化看u的情况,需要根据u分为以下⼏种情况分别处理。

说明:下面都假设把新增结点标识为c (cur),c的⽗亲标识为p(parent),p的⽗亲标识为g(grandfather),p的兄弟标识为u(uncle)


情况1:变⾊

c为红,p为红,g为⿊,u存在且为红,则将p和u变⿊,g变红。在把g当做新的c,继续往上更新。
分析:因为p和u都是红⾊,g是⿊⾊,把p和u变⿊,左边⼦树路径各增加⼀个⿊⾊结点,g再变红,相当于保持g所在⼦树的⿊⾊结点的数量不变,同时解决了c和p连续红⾊结点的问题,需要继续往上更新是因为,g是红⾊,如果g的⽗亲还是红⾊,那么就还需要继续处理;如果g的⽗亲是⿊⾊,则处理结束了;如果g就是整棵树的根,再把g变回⿊⾊。
情况1只变⾊,不旋转。所以⽆论c是p的左还是右,p是g的左还是右,都是上⾯的变⾊处理⽅式。

  1. 跟AVL树类似,图0我们展⽰了⼀种具体情况,但是实际中需要这样处理的有很多种情况。
  2. 图1将以上类似的处理进⾏了抽象表达,d/e/f代表每条路径拥有hb个⿊⾊结点的⼦树,a/b代表每 条路径拥有hb-1个⿊⾊结点的根为红的⼦树,hb>=0。
  3. 图2/图3/图4,分别展⽰了hb == 0/hb == 1/hb == 2的具体情况组合分析,当hb等于2时,这⾥组合情况上百亿种,这些样例是帮助我们理解,不论情况多少种,多么复杂,处理⽅式⼀样的,变⾊再继续往上处理即可,所以我们只需要看抽象图即可


情况2:单旋+变⾊

c为红,p为红,g为⿊,u不存在或者u存在且为⿊,u不存在,则c⼀定是新增结点,u存在且为⿊,则c⼀定不是新增,c之前是⿊⾊的,是在c的⼦树中插⼊,符合情况1,变⾊将c从⿊⾊变成红⾊,更新上来的。

  1. **右单旋:**如果p是g的左,c是p的左,那么以g为旋转点进⾏右单旋,再把p变⿊,g变红即可。p变成这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为p的⽗亲是⿊⾊还是红⾊或者空都不违反规则。
  2. **左单旋:**如果p是g的右,c是p的右,那么以g为旋转点进⾏左单旋,再把p变⿊,g变红即可。p变成课这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为p的⽗亲是⿊⾊还是红⾊或者空都不违反规则。

下面以右旋为例:


情况3:双旋+变⾊

c为红,p为红,g为⿊,u不存在或者u存在且为⿊,u不存在,则c⼀定是新增结点,u存在且为⿊,则c⼀定不是新增,c之前是⿊⾊的,是在c的⼦树中插⼊,符合情况1,变⾊将c从⿊⾊变成红⾊,更新上来的。

  1. **左右双旋:**如果p是g的左,c是p的右,那么先以p为旋转点进⾏左单旋,再以g为旋转点进⾏右单旋,再把c变⿊,g变红即可。c变成课这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的⽗亲是⿊⾊还是红⾊或者空都不违反规则。
  2. **右左双旋:**如果p是g的右,c是p的左,那么先以p为旋转点进⾏右单旋,再以g为旋转点进⾏左单旋,再把c变⿊,g变红即可。c变成课这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的⽗亲是⿊⾊还是红⾊或者空都不违反规则。
    下面以左右双旋为例:

红黑树的插入代码实现

cpp 复制代码
bool Insert(const pair<K, V>& kv)
{
	if (_root == nullptr)
	{
		_root=new Node(kv);
		_root->_col = BLACK;//根节点为黑色
		return true;
	}

	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;//去重
		}
	}

	cur = new Node(kv);
	cur->_col = RED;

	if (parent->_kv.first<kv.first)
	{
		parent->_right = cur;
	}
	else
	{
		parent->_left = cur;
	}
	cur->_parent = parent;//链接父亲
	
	//父亲是红色,出现连续红色节点,需要处理
	while (parent&&parent->_col==RED)//注意如果grandparent是整个树的根,
	{//那么cur->_parent为空即parent为空再进循环parent->_col==RED就空指针解引用,所以要先判断parent是否为空
		Node* grandfather = parent->_parent;

		if(grandfather->_left ==parent)
		{
			//    g
			//  p   u
			Node* uncle = grandfather->_right;
			if (uncle && uncle->_col == RED)//情况一
			{
				//变色
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;

				//继续往上处理
				cur = grandfather;
				parent= cur->_parent;
			}
			else //旋转
			{	
				if (cur == parent->_left)//单旋
				{
					//     g
					//   p   u
					// c
					RotateR(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else//双旋
				{
					//      g
					//   p    u
					//    c
					RotateL(parent);
					RotateR(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}

				break;
			}
		}
		else
		{
			//   g
			// u  p
			Node* uncle = grandfather->_left;
			// 叔叔存在且为红,变⾊即可
			if (uncle && uncle->_col == RED)
			{
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;
				// 继续往上处理
				cur = grandfather;
				parent = cur->_parent;
			}
			else // 叔叔不存在,或者存在且为⿊
			{
				// 情况⼆:叔叔不存在或者存在且为⿊
				// 旋转+变⾊
				//   g
				// u   p
				//       c
				if (cur == parent->_right)
				{
					RotateL(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else
				{
					//     g
					//  u    p
					//     c
					RotateR(parent);
					RotateL(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
	}
	_root->_col = BLACK;///不管什么情况root都置为黑
	return true;
}

3.红黑树的验证

这⾥获取最⻓路径和最短路径,检查最⻓路径不超过最短路径的2倍是不可⾏的,因为就算满⾜这个条件,红⿊树也可能颜⾊不满⾜规则,当前暂时没出问题,后续继续插⼊还是会出问题的。所以我们还是去检查4点规则,满⾜这4点规则,⼀定能保证最⻓路径不超过最短路径的2倍。

  1. 规则1枚举颜⾊类型,天然实现保证了颜⾊不是⿊⾊就是红⾊。
  2. 规则2直接检查根即可
  3. 规则3前序遍历检查,遇到红⾊结点查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检 查⽗亲的颜⾊就⽅便多了。
  4. 规则4前序遍历,遍历过程中⽤形参记录根到当前结点的blackNum(⿊⾊结点数量),前序遍历遇到 ⿊⾊结点就++blackNum,⾛到空就计算出了⼀条路径的⿊⾊结点数量。再任意⼀条路径⿊⾊结点 数量作为参考值,依次⽐较即可。

4.红黑树完整代码实现

RBTree.h

cpp 复制代码
#define _CRT_SECURE_NO_WARNINGS 1


#include<iostream>
using namespace std;
#include<assert.h>
#include<vector>
//枚举值表示颜色
enum Color
{
	RED=1,
	BLACK
};

//默认按key/value结构实现
template<class K,class V>
struct RBTreeNode
{
	// 这⾥更新控制平衡也要加⼊parent指针
	pair<K, V> _kv;
	RBTreeNode<K, V>* _left;
	RBTreeNode<K, V>* _right;
	RBTreeNode<K, V>* _parent;
	Color _col;
	RBTreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
	{
	}
};

template<class K, class V>
class RBTree
{
	typedef RBTreeNode<K, V> Node;
public:

	RBTree() = default;

	bool Insert(const pair<K, V>& kv)
	{
		if (_root == nullptr)
		{
			_root=new Node(kv);
			_root->_col = BLACK;//根节点为黑色
			return true;
		}

		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;//去重
			}
		}

		cur = new Node(kv);
		cur->_col = RED;

		if (parent->_kv.first<kv.first)
		{
			parent->_right = cur;
		}
		else
		{
			parent->_left = cur;
		}
		cur->_parent = parent;//链接父亲
		
		//父亲是红色,出现连续红色节点,需要处理
		while (parent&&parent->_col==RED)//注意如果grandparent是整个树的根,
		{//那么cur->_parent为空即parent为空再进循环parent->_col==RED就空指针解引用,所以要先判断parent是否为空
			Node* grandfather = parent->_parent;

			if(grandfather->_left ==parent)
			{
				//    g
				//  p   u
				Node* uncle = grandfather->_right;
				if (uncle && uncle->_col == RED)//情况一
				{
					//变色
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;

					//继续往上处理
					cur = grandfather;
					parent= cur->_parent;
				}
				else //旋转
				{	
					if (cur == parent->_left)//单旋
					{
						//     g
						//   p   u
						// c
						RotateR(grandfather);
						parent->_col = BLACK;
						grandfather->_col = RED;
					}
					else//双旋
					{
						//      g
						//   p    u
						//    c
						RotateL(parent);
						RotateR(grandfather);
						cur->_col = BLACK;
						grandfather->_col = RED;
					}

					break;
				}
			}
			else
			{
				//   g
				// u  p
				Node* uncle = grandfather->_left;
				// 叔叔存在且为红,变⾊即可
				if (uncle && uncle->_col == RED)
				{
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;
					// 继续往上处理
					cur = grandfather;
					parent = cur->_parent;
				}
				else // 叔叔不存在,或者存在且为⿊
				{
					// 情况⼆:叔叔不存在或者存在且为⿊
					// 旋转+变⾊
					//   g
					// u   p
					//       c
					if (cur == parent->_right)
					{
						RotateL(grandfather);
						parent->_col = BLACK;
						grandfather->_col = RED;
					}
					else
					{
						//     g
						//  u    p
						//     c
						RotateR(parent);
						RotateL(grandfather);
						cur->_col = BLACK;
						grandfather->_col = RED;
					}
					break;
				}
			}
		}
		_root->_col = BLACK;///不管什么情况root都置为黑
		return true;
	}

	void RotateR(Node* parent)
	{
		// 记录 parent 的左孩子 subL 和 subL 的右孩子 subLR
		Node* subL = parent->_left;
		Node* subLR = subL->_right;

		parent->_left = subLR;
		if (subLR)
			subLR->_parent = parent;

		Node* Pparent = parent->_parent;

		subL->_right = parent;
		parent->_parent = subL;

		if (Pparent == nullptr)//parent为根,修改根节点
		{
			_root = subL;
			subL->_parent = nullptr;//subL为根,根节点父指针置空
		}
		else//将Pparent与新节点subL链接
		{

			subL->_parent = Pparent;
			// 判断 parent 原来是祖父节点的左孩子还是右孩子
			if (Pparent->_left == parent)
			{
				Pparent->_left = subL;

			}
			else
			{
				Pparent->_right = subL;
			}
		}
	}

	void RotateL(Node* parent)
	{
		// 1. 记录parent的右孩子subR,以及subR的左孩子subRL
		Node* subR = parent->_right;
		Node* subRL = subR->_left;

		// 2. 将subRL变成parent的右孩子
		parent->_right = subRL;
		// 如果subRL不为空,更新它的父指针指向parent
		if (subRL)
			subRL->_parent = parent;

		// 3. 记录parent原来的父节点(祖父节点)
		Node* Pparent = parent->_parent;

		// 4. 将parent变成subR的左孩子
		subR->_left = parent;
		parent->_parent = subR;

		// 5. 将subR与祖父节点链接
		if (Pparent == nullptr)  // parent原来是根节点
		{
			_root = subR;           // 更新根节点为subR
			subR->_parent = nullptr; // 新根节点的父指针置空
		}
		else  // parent不是根节点
		{
			subR->_parent = Pparent;  // subR的父指针指向祖父节点
			// 判断parent原来是祖父节点的左孩子还是右孩子
			if (Pparent->_left == parent)
			{
				Pparent->_left = subR;   // 祖父节点的左孩子指向subR
			}
			else
			{
				Pparent->_right = subR;  // 祖父节点的右孩子指向subR
			}
		}
	}

	void InOrder()
	{
		_inorder(_root);
		cout << endl;
	}

	int Height()
	{
		return _Height(_root);
	}

	int Size()
	{
		return _size(_root);
	}

	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < key)
			{
				cur = cur->_right;
			}
			else if (cur->_kv.first > key)
			{
				cur = cur->_left;
			}
			else
			{
				return cur;
			}
		}
		return nullptr;
	}

	bool Check(Node* root, int blackNum, const int refNum)
	{
		if (root == nullptr)
		{
			// 前序遍历⾛到空时,意味着⼀条路径⾛完了
			//cout << blackNum << endl;
			if (refNum != blackNum)
			{
				cout << "存在⿊⾊结点的数量不相等的路径" << endl;
				return false;
			}
			return true;
		}
		// 检查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲就⽅便多了
		if (root->_col == RED && root->_parent->_col == RED)
		{
			cout << root->_kv.first << "存在连续的红⾊结点" << endl;
			return false;
		}
		if (root->_col == BLACK)
		{
			blackNum++;
		}
		return Check(root->_left, blackNum, refNum)
			&& Check(root->_right, blackNum, refNum);
	}

	bool IsBalance()
	{
		if (_root == nullptr)
			return true;
		if (_root->_col == RED)
			return false;
		// 参考值
		int refNum = 0;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_col == BLACK)
			{
				++refNum;
			}
			cur = cur->_left;
		}
		return Check(_root, 0, refNum);
	}
	

	// 析构函数
	~RBTree()
	{
		clear();
	}

	// 清空树
	void clear()
	{
		Destroy(_root);
		_root = nullptr;
	}

	// 拷贝构造函数 - 如果需要深拷贝
	RBTree(const RBTree& other)
	{
		if (other._root)
		{
			_root = Copy(other._root, nullptr);
		}
	}

	// 赋值运算符 - 如果需要深拷贝
	RBTree& operator=(const RBTree& other)
	{
		if (this != &other)
		{
			clear();  // 先清理当前资源
			if (other._root)
			{
				_root = Copy(other._root, nullptr);
			}
		}
		return *this;
	}
	
private:

	void _inorder(Node* root)
	{
		if (root == nullptr)
			return;
		_inorder(root->_left);
		cout << root->_kv.first << ":" << root->_kv.second << endl;
		_inorder(root->_right);
	}

	int _Height(Node* root)
	{
		if (root == nullptr)
			return 0;
		int leftHeight = _Height(root->_left);
		int rightHeight = _Height(root->_right);
		return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
	}

	int _size(Node* root)
	{
		if (root == nullptr)
			return 0;
		return _size(root->_left) + 1 + _size(root->_right);
	}

	// 递归销毁辅助函数
	void Destroy(Node* root)
	{
		if (root == nullptr)
			return;

		Destroy(root->_left);
		Destroy(root->_right);
		delete root;
	}

	// 深拷贝辅助函数(如果需要拷贝功能)
	Node* Copy(Node* root, Node* parent)
	{
		if (root == nullptr)
			return nullptr;

		Node* newNode = new Node(root->_kv);
		newNode->_col = root->_col;
		newNode->_parent = parent;

		newNode->_left = Copy(root->_left, newNode);
		newNode->_right = Copy(root->_right, newNode);

		return newNode;
	}

	Node* _root = nullptr;
};

test.cpp

cpp 复制代码
#define _CRT_SECURE_NO_WARNINGS 1
#include"RBTree.h"




// 测试代码
void TestRBTree1()
{
	RBTree<int, int> t;
	// 常规的测试⽤例
	//int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
	// 特殊的带有双旋场景的测试⽤例
	int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
	for (auto e : a)
	{
		t.Insert({ e, e });
	}
	t.InOrder();
	cout << t.IsBalance() << endl;
}



// 插⼊⼀堆随机值,测试平衡,顺便测试⼀下⾼度和性能等
void TestRBTree2()
{
	const int N = 1000000;
	vector<int> v;
	v.reserve(N);
	srand(time(0));
	for (size_t i = 0; i < N; i++)
	{
		v.push_back(rand() + i);
	}
	size_t begin2 = clock();
	RBTree<int, int> t;
	for (auto e : v)
	{
		t.Insert(make_pair(e, e));
	}
	size_t end2 = clock();
	cout << "Insert:" << end2 - begin2 << endl;

	cout << "Height:" << t.Height() << endl;
	cout << "Size:" << t.Size() << endl;
	size_t begin1 = clock();
	// 确定在的值
	/*for (auto e : v)
	{
	t.Find(e);
	}*/
	// 随机值
	for (size_t i = 0; i < N; i++)
	{
		t.Find((rand() + i));
	}
	size_t end1 = clock();
	cout << "Find:" << end1 - begin1 << endl;

	cout << t.IsBalance() << endl;
}


int main()
{
	TestRBTree1();
	TestRBTree2();
	return 0;
}
相关推荐
cui_ruicheng2 小时前
C++数据结构进阶:哈希表实现
数据结构·c++·算法·哈希算法·散列表
逆境不可逃2 小时前
LeetCode 热题 100 之 35. 搜索插入位置 74. 搜索二维矩阵 34. 在排序数组中查找元素的第一个和最后一个位置
数据结构·算法·leetcode
浅念-2 小时前
C ++ 智能指针
c语言·开发语言·数据结构·c++·经验分享·笔记·算法
不染尘.2 小时前
最小生成树算法
开发语言·数据结构·c++·算法·图论
Klong.k3 小时前
判断是不是素数题目
数据结构·算法
Morwit3 小时前
*【力扣hot100】 215. 数组中的第K个最大元素
数据结构·c++·算法·leetcode·职场和发展
ab1515173 小时前
3.20二刷基础121、127,完成进阶61、62
数据结构·算法·排序算法
I_LPL3 小时前
day58 代码随想录算法训练营 图论专题11
数据结构·算法·图论
小比特_蓝光4 小时前
算法篇1-----双指针
数据结构·算法