AVL树的实现

一.AVL树的概念与结构

1.AVL树的概念

1.1.为什么用AVL树

原因:普通的二叉搜索树(BST)在插入有序数据(如 1, 2, 3, 4, 5)时,会变成一个只有右孩子的长链,此时二叉搜索树 的查找效率就从O(log N)退化到O(N),但是AVL 树:通过旋转机制,强制保证左右子树高度差不超过 1,使得树高始终维持在O(log N)。

1.2.AVL树的概念

概念: AVL是⼀颗空树,或者具备下列性质的⼆叉搜索树:它的左右⼦树都是AVL树,且左右⼦树的高度差(平衡因子)的绝对值不超过1。

例如:

注意:上面的每一个数上的数字就是平衡因子

特点: AVL树实现这⾥我们引⼊⼀个平衡因⼦(balancefactor)的概念,每个结点都有⼀个平衡因⼦,任何结点的平衡因子等于右⼦树的高度减去左子树的高度,也就是说任何结点的平衡因⼦等于0/1/-1, AVL树并不是必须要平衡因⼦,但是有了平衡因⼦可以更⽅便我们去进⾏观察和控制树是否平衡, 就像⼀个⻛向标⼀样。

问:为什么AVL树是高度平衡搜索⼆叉树,要求高度差不超过1,⽽不是高度差是0呢?0不是更好的平衡吗?

原因:0不是更好的平衡吗?画画图分析我们发现,不是不想这样设计,而是有些情况是做不到高度差是0的,比如⼀棵树是2个结点,4个结点等情况下,高度差最好就是1,无法做到高度差是0。

效率:AVL树整体结点数量和分布和完全二叉树类似,高度可以控制在 ,那么增删查改的效率也可 以控制在O(logN) ,相比二叉搜索树有了本质的提升。

但是如果树长成这样,就不是AVL树,此时就需要通过旋转使其变成AVL树。

2.AVL树的结构

首先我们定义两个文件,一个为AVLTree.h,另一个为AVL_Test.cpp

在AVLTree.h中,我们先实现每一个节点,例如:

cpp 复制代码
#include<iostream>
#include<assert.h>
#include<vector>
using namespace std;
template<class K,class V>
struct AVLTNode
{
	pair<K, V> _kv;
	AVLTNode<K, V>* _left;
	AVLTNode<K, V>* _right;
	//parent指针用于后续更新平衡因子
	AVLTNode<K, V>* _parent;
	int _bf;
	//构造函数
	AVLTNode(const pair<K,V>& kv)
		:_kv(kv)
		,_left(nullptr)
		,_right(nullptr)
		,_parent(nullptr)
		,_bf(0)
		{}
};

解释:其中的pair<K, V> _kv;不需要我们去实现,AVLTNode<K, V>* _left;AVLTNode<K, V>* _right;与搜索二叉树类似,AVLTNode<K, V>* _parent;中的parent指针用于后续更新平衡因子

_bf用于记录平衡因子

cpp 复制代码
template<class K, class V>
class AVLTree
{
        typedef AVLTreeNode<K, V> Node;
public:
        //...
private:
    Node* _root = nullptr;
};

这个就为树的大框架

二.AVL树的插入(难点)

1.插入大概过程

1.1.过程

<1>. 插入⼀个值按⼆叉搜索树规则进行插⼊。

<2>. 新增结点以后,只会影响祖先结点的高度,也就是可能会影响部分祖先结点的平衡因子,所以更新 从新增结点->根结点路径上的平衡因子,实际中最坏情况下要更新到根,有些情况更新到中间就可以停止了,具体情况我们下面再详细分析。

<3>. 更新平衡因子过程中没有出现问题,则插入结束。

<4>. 更新平衡因子过程中出现不平衡,对不平衡子树旋转,旋转后本质调平衡的同时,本质降低了子树 的高度,不会再影响上⼀层,所以插入结束。

1.2.平衡因子更新

1.2.1.更新原则:

• 平衡因子=左子树高度-左子树高度(也可以左子树高度-右子树高度,取决于自己)。

• 只有子树高度变化才会影响当前结点平衡因子。

• 插⼊结点,会增加高度,所以新增结点在parent的右子树,parent的平衡因子++,新增结点在 parent的左子树,parent平衡因子--

• parent所在子树的高度是否变化决定了是否会继续往上更新。

1.2.2.更新停止条件:

• 更新后parent的平衡因子等于0,说明更新中parent的平衡因子变化为-1->0或者1->0,说明更新前 parent子树⼀边高⼀边低,新增的结点插入在低的那边,插入后parent所在的子树高度不变,不会影响parent的父亲结点的平衡因子,更新结束。

例如: 3为根的子树高度不变,不会影响上⼀层,更新结束

• 更新后parent的平衡因子等于1或-1,更新前更新中parent的平衡因子变化为0->1或者0->-1,说 明更新前parent子树两边⼀样高,新增的插⼊结点后,parent所在的子树⼀边高⼀边低,parent所 在的子树符合平衡要求,但是高度增加了1,会影响parent的父亲结点的平衡因⼦,所以要继续向上更新。

例如:1为根的子树高度改变,影响上⼀层,更新继续,使cur=parent,parent=parent->_parent

• 更新后parent的平衡因⼦等于2或-2,更新前更新中parent的平衡因⼦变化为1->2或者-1->-2,说 明更新前parent子树⼀边高⼀边低,新增的插入结点在高的那边,parent所在的子树高的那边更高了,破坏了平衡,parent所在的子树不符合平衡要求,需要旋转处理,旋转的目标有两个:1、把 parent子树旋转平衡。2、降低parent⼦树的高度,恢复到插⼊结点以前的高度。所以旋转后也不 需要继续往上更新,插入结束。

例如:更新到10结点,平衡因子为2,10所在的子树已经不平衡,需要旋转处理

• 不断更新,更新到根,根的平衡因子是1或-1也停止了。

例如:

那么插入的代码就可以这样写:

cpp 复制代码
bool Insert(const pair<K, V>& kv)
{
	if (_root == nullptr)
	{
		_root = new Node(kv);
		return true;
	}

	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;
		}
	}
	cur = new Node(kv);
	if (parent->_kv.first < kv.first)
	{
		parent->_right = cur;
	}
	else
	{
		parent->_left = cur;
	}
	cur->_parent = parent;

	while (parent)
	{
        //更新平衡因子
		if (parent->_left == cur)
		{
			parent->_bf--;
		}
		else
		{
			parent->_bf++;
		}
        //查找更新平衡因子后,要旋转的节点
		if (parent->_bf == 0)
		{
			break;
		}
		else if (parent->_bf == 1 || parent->_bf == -1)
		{
			cur = parent;
			parent = parent->_parent;
		}
		else if (parent->_bf == 2 || parent->_bf == -2)
		{
			if (parent->_bf == -2 && cur->_bf == -1)
			{
				Rotate_Right(parent);
			}
			else if (parent->_bf == 2 && cur->_bf == 1)
			{
				Rotate_Left(parent);
			}
			else if (parent->_bf == -2 && cur->_bf == 1)
			{
				Rotate_Left_Right(parent);
			}
			else if (parent->_bf == 2 && cur->_bf == -1)
			{
				Rotate_Right_Left(parent);
			}
			else 
			{
				assert(false);
			}
			break;
		}
		else
		{
			assert(false);
		}
	}
	return true;
}

解释:其实前面的代码就是寻找要插入节点的地方,没有找到,就返回false,找到了,就插入节点,而cur->_parent = parent;就用于指向cur自己的父亲节点,然后在parent循环中,先更新平衡因子,再判断更新后的平衡因子是否满足更新停止条件,满足停止条件就停止更新,不满足停止条件就继续向上更新,如果遇到parent->_bf的绝对值大于1,就需要旋转(Rotate)。

2.旋转

规则:

<1>. 保持搜索树的规则

<2>. 让旋转的树从不满足变平衡,其次降低旋转树的高度

旋转总共分为四种,左单旋/右单旋/左右双旋/右左双旋。

注意:下面的图中,有些结点我们给的是具体值,如10和5等结点,这里是为了方便讲解,实际中是什 么值都可以,只要大小关系符合搜索树的性质即可。

2.1.右单旋

• 本图1展示的是10为根的树,有a/b/c抽象为三棵高度为h的子树(h>=0),a/b/c均符合AVL树的要 求。10可能是整棵树的根,也可能是⼀个整棵树中局部的子树的根。这里a/b/c是高度为h的⼦树, 是⼀种概括抽象表示,他代表了所有右单旋的场景,实际右单旋形态有很多种,具体图2/图3/图4/ 图5进⾏了详细描述。

• 在a子树中插入⼀个新结点,导致a子树的高度从h变成h+1,不断向上更新平衡因⼦,导致10的平衡因子从-1变成-2,10为根的树左右高度差超过1,违反平衡规则。10为根的树左边太高了,需要 往右边旋转,控制两棵树的平衡。

• 旋转核心步骤,因为5<b子树的值<10,为将b变成10的左子树,10变成5的右子树,5变成这棵树新 的根,符合搜索树的规则,控制了平衡,同时这棵的高度恢复到了插入之前的h+2,符合旋转原 则。如果插入之前10整棵树的⼀个局部子树,旋转后不会再影响上一层,插入结束了。

例如:这个抽象例子

解释:在这个图中,a,b,c的高度必须存在且相等,如果b的高度比a小1,就会导致在a处插入时,5的平衡因子变为-2,那么要旋转的就不是10这个节点,如果c的高度比a和b小1,就会导致插入前就不满足AVL树,所以也不满足插入条件,满足a,b,c的高度必须存在(高度>=0)且相等后,我们在5(parent)的右边a插入一个节点,会导致5的平衡因子由0->-1,parent向上更新,此时10这个parent平衡因子变为-2,那么我们就进行对10进行右单旋,降低10的高度,就可以将高度为h+1的a给subL,subLR变为parent的左边,此时subL与parent的左右两边高度均相等,平衡因子也就变为了0。

具体的例子:

我们可以通过以上的例子,了解右单旋的抽象实例。

代码:

cpp 复制代码
void Rotate_Right(Node* parent)
{
	Node* subL = parent->_left;
	Node* subLR = subL->_right;
	Node* Pparent = parent->_parent;

	subL->_right = parent;
	parent->_left = subLR;
	parent->_parent = subL;
	if (subLR)
	{
		subLR->_parent = parent;
	}

	//parent为根节点的情况
	if (_root == parent)
	{
		_root = subL;
		subL->_parent = nullptr;
	}
	else
	{
		if (Pparent->_left == parent)
		{
			Pparent->_left = subL;
		}
		//Pparent->_right == parent
		else
		{
			Pparent->_right = subL;
		}
		subL->_parent = Pparent;
	}

	//更新平衡因子
	subL->_bf = parent->_bf = 0;
}

解释:我们先定义subL与subLR,分别为parent的左边,subL的右边,我们不光要要改变subL的右指向parent,parent的左指向subLR,还要考虑subLR不为nullptr时,使subLR的_parent指向parent,parent的_parent指向subL,而且还要考虑parent为_root时,改变_root与subL的parent,以及parent不为_root时,记录一个Pparent为parent的父亲节点,使PParent的左边/右边指向subL,subL的_parent指向Pparent,最后改变subL->_bf 与 parent->_bf 的平衡因子。

2.2.左单旋

本图6展示的是10为根的树,有a/b/c抽象为三棵高度为h的子树(h>=0),a/b/c均符合AVL树的要求。10可能是整棵树的根,也可能是⼀个整棵树中局部的⼦树的根。这⾥a/b/c是⾼度为h的⼦树, 是⼀种概括抽象表⽰,他代表了所有右单旋的场景,实际右单旋形态有很多种,具体跟上⾯左旋类 似。

• 在a子树中插入一个新结点,导致a子树的高度从h变成h+1,不断向上更新平衡因子,导致10的平衡因子从1变成2,10为根的树左右高度差超过1,违反平衡规则。10为根的树右边太⾼了,需要往 左边旋转,控制两棵树的平衡。

• 旋转核⼼步骤,因为10<b子树的值<15,将b变成10的右⼦树,10变成15的左⼦树,15变成这棵 树新的根,符合搜索树的规则,控制了平衡,同时这棵的⾼度恢复到了插⼊之前的h+2,符合旋转 原则。如果插⼊之前10整棵树的⼀个局部⼦树,旋转后不会再影响上⼀层,插⼊结束了。

例如:

代码:

cpp 复制代码
void Rotate_Left(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;
	Node* Pparent = parent->_parent;

	subR->_left = parent;
	parent->_right = subRL;
	parent->_parent = subR;
	if (subRL)
	{
		subRL->_parent = parent;
	}
	if (parent == _root)
	{
		_root = subR;
		subR->_parent = nullptr;
	}
	else
	{
		if (Pparent->_left == parent)
		{
			Pparent->_left = subR;
		}
		//Pparent->_right == parent
		else
		{
			Pparent->_right = subR;
		}
		subR->_parent = Pparent;
	}

	//更新平衡因子
	subR->_bf = parent->_bf = 0;
}

2.3.左右双旋

通过图1和图2可以看到,左边⾼时,如果插⼊位置不是在a⼦树,⽽是插⼊在b⼦树,b⼦树⾼度从h变 成h+1,引发旋转,右单旋⽆法解决问题,右单旋后,我们的树依旧不平衡。右单旋解决的纯粹的左边 ⾼,但是插⼊在b⼦树中,10为跟的⼦树不再是单纯的左边⾼,对于10是左边⾼,但是对于5是右边 ⾼,需要⽤两次旋转才能解决,以5为旋转点进⾏⼀个左单旋,以10为旋转点进⾏⼀个右单旋,这棵树 这棵树就平衡了。

如图1:

如图2:

• 图1和图2分别为左右双旋中h==0和h==1具体场景分析,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL ⼦树进⾏分析,另外我们需要把b⼦树的细节进⼀步展开为8和左⼦树⾼度为h-1的e和f⼦树,因为 我们要对b的⽗亲5为旋转点进⾏左单旋,左单旋需要动b树中的左⼦树。b⼦树中新增结点的位置 不同,平衡因⼦更新的细节也不同,通过观察8的平衡因⼦不同,这⾥我们要分三个场景讨论。

• 场景1:h>=1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1并为h并不断更新8->5->10平衡因⼦, 引发旋转,其中8的平衡因⼦为-1,旋转后8和5平衡因⼦为0,10平衡因⼦为1。

• 场景2:h>=1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新8->5->10平衡因⼦,引 发旋转,其中8的平衡因⼦为1,旋转后8和10平衡因⼦为0,5平衡因⼦为-1。

• 场景3:h==0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新5->10平衡因⼦,引发旋 转,其中8的平衡因⼦为0,旋转后8和10和5平衡因⼦均为0。

代码:

cpp 复制代码
void Rotate_Left_Right(Node* parent)
{
	Node* subL = parent->_left;
	Node* subLR = subL->_right;
	int bf = subLR->_bf;

	Rotate_Left(parent->_left);
	Rotate_Right(parent);
	if (bf == 0)
	{
		parent->_bf = 0;
		subL->_bf = 0;
		subLR->_bf = 0;
	}
	else if (bf == -1)
	{
		parent->_bf = 1;
		subL->_bf = 0;
		subLR->_bf = 0;
	}
	else if (bf == 1)
	{
		parent->_bf = 0;
		subL->_bf = -1;
		subLR->_bf = 0;
	}
	else 
	{
		assert(false);
	}
}
2.4.右左双旋

• 跟左右双旋类似,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL⼦树进⾏分析,另外我们需要把b⼦树的 细节进⼀步展开为12和左⼦树⾼度为h-1的e和f⼦树,因为我们要对b的⽗亲15为旋转点进⾏右单 旋,右单旋需要动b树中的右⼦树。b⼦树中新增结点的位置不同,平衡因⼦更新的细节也不同,通 过观察12的平衡因⼦不同,这⾥我们要分三个场景讨论。

• 场景1:h>=1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1变为h并不断更新12->15->10平衡因 ⼦,引发旋转,其中12的平衡因⼦为-1,旋转后10和12平衡因⼦为0,15平衡因⼦为1。

• 场景2:h>=1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新12->15->10平衡因⼦, 引发旋转,其中12的平衡因⼦为1,旋转后15和12平衡因⼦为0,10平衡因⼦为-1。

• 场景3:h==0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新15->10平衡因⼦,引发旋 转,其中12的平衡因⼦为0,旋转后10和12和15平衡因⼦均为0。

如图:

代码:

cpp 复制代码
void Rotate_Right_Left(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;
	int bf = subRL->_bf;

	Rotate_Right(parent->_right);
	Rotate_Left(parent);
	if (bf == 0)
	{
		parent->_bf = 0;
		subR->_bf = 0;
		subRL->_bf = 0;
	}
	else if (bf == 1)
	{
		parent->_bf = -1;
		subR->_bf = 0;
		subRL->_bf = 0;
	}
	else if (bf == -1)
	{
		parent->_bf = 0;
		subR->_bf = 1;
		subRL->_bf = 0;
	}
	else
	{
		assert(false);
	}
}

三.其他接口实现

1.中序遍历

代码:

cpp 复制代码
void InOrder()
{
	_InOrder(_root);
}
void _InOrder(Node* root)
{
	if (root == nullptr)
	{
		return;
	}
	_InOrder(root->_left);
	cout << root->_kv.first << ":" << root->_kv.second << endl;
	_InOrder(root->_right);
}

2.查找值为key接口

代码:

cpp 复制代码
Node* Find(const K& key)
{
	return _Find(key);
}
Node* _Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < key)
		{
			cur = cur->_right;
		}
		else if (cur->_kv.first > key)
		{
			cur = cur->_left;
		}
		else
		{
			return cur;
		}
	}
	return nullptr;
}

3.计算树的容量

代码:

cpp 复制代码
int Size()
{
	return _Size(_root);
}
int _Size(Node* root)
{
	if (root == nullptr)
	{
		return 0;
	}
	return _Size(root->_left) + _Size(root->_right) + 1;
}

4.计算树的高度

代码:

cpp 复制代码
int Height()
{
	return _Height(_root);
}
int _Height(Node* root)
{
	if (root == nullptr)
	{
		return 0;
	}
	int Height_Left = _Height(root->_left);
	int Height_Right = _Height(root->_right);
	return Height_Left > Height_Right ? Height_Left + 1 : Height_Right + 1;
}

5.检查是否为AVL树

代码:

cpp 复制代码
bool IsBalanceTree()
{
	return _IsBalanceTree(_root);
}
bool _IsBalanceTree(Node* root)
{
	if (root == nullptr)
	{
		return true;
	}
	int Height_Left = _Height(root->_left);
	int Height_Right = _Height(root->_right);
	int diff = Height_Right - Height_Left;

	if (abs(diff) >= 2)
	{
		cout << root->_kv.first <<":" << "高度差异常" << endl;
		return false;
	}
	if (root->_bf != diff)
	{
		cout << root->_kv.first << ":" << "平衡因子异常" << endl;
		return false;
	}
	return _IsBalanceTree(root->_left) && _IsBalanceTree(root->_right);
}

6.析构函数

代码:

cpp 复制代码
~AVLTree()
{
	_Destroy(_root);
	_root = nullptr;
}
void _Destroy(Node* root)
{
	if (root == nullptr)
	{
		return;
	}
	_Destroy(root->_left);
	_Destroy(root->_right);
	delete root;
	root = nullptr;
}

注意:其他接口实现时,实现代码应改放在private,否则可能会因为调用接口时,调用了含有_root的接口,因为_root为private而报错。

四.AVL树的测试

代码:

cpp 复制代码
#include"AVLTree.h"
void TestAVLTree1()
{
    kong_AVLTree::AVLTree<int, int> t;
    // 常规的测试⽤例
    //int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
    //特殊的带有双旋场景的测试⽤例
    int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
    for (auto e : a)
    {
        t.Insert({ e, e });
    }
    t.InOrder();
    cout << t.IsBalanceTree() << endl;
}
void TestAVLTree2()
{
    const int N = 100000;
    vector<int> v;
    v.reserve(N);
    srand(time(0));
    for (size_t i = 0; i < N; i++)
    {
        v.push_back(rand() + i);
    }
    size_t begin2 = clock();
    kong_AVLTree::AVLTree<int, int> t;
    for (auto e : v)
    {
        t.Insert(make_pair(e, e));
    }
    size_t end2 = clock();
    cout << "Insert:" << end2 - begin2 << endl;
    cout << "Height:" << t.Height() << endl;
    cout << "Size:" << t.Size() << endl;
    size_t begin1 = clock();
    // 确定在的值

   /*for (auto e : v)
   {
      t.Find(e);
    }*/
    // 随机值
    for (size_t i = 0; i < N; i++)
    {
        t.Find((rand() + i));
    }
    size_t end1 = clock();
    cout << "Find:" << end1 - begin1 << endl; 
    cout << "是否为平衡树:";
    cout << t.IsBalanceTree() << endl;
}
int main()
{
    TestAVLTree1();
    TestAVLTree2();
	return 0;
}

我们可以通过这个代码测试这个树是否为AVL树,以及测试AVL树的效率。

相关推荐
遥望九龙湖1 小时前
打包动态库
开发语言·c++·visualstudio
tankeven2 小时前
HJ101 排序
c++·算法
不想看见4042 小时前
01 Matrix 基本动态规划:二维--力扣101算法题解笔记
c++·算法·leetcode
踢足球09292 小时前
寒假打卡:2026-2-23
数据结构·算法
麻瓜pro2 小时前
【迭代】高性能c++实时对话系统e2e_voice
开发语言·c++·onnxruntime·端到端语音
特种加菲猫2 小时前
深入理解string:通过模拟实现探讨其内部机制
c++
A星空1232 小时前
二、交叉编译工具链(arm-linux-gnueabihf-gcc)安装与验证,搭建 TFTP+NFS 服务,调试开发板网络连通性;
linux·c++·驱动开发·单片机·嵌入式硬件
郝学胜-神的一滴3 小时前
Effective Modern C++ 条款40:深入理解 Atomic 与 Volatile 的多线程语义
开发语言·c++·学习·算法·设计模式·架构
骇城迷影3 小时前
代码随想录:二叉树篇(中)
数据结构·c++·算法·leetcode