前言
学习了普通二叉树,发现普通二叉树作用不大,于是我们学习了搜索二叉树,给二叉树新增了搜索、排序、去重等特性,
但是,在极端情况下搜索二叉树会退化成单边树,搜索的时间复杂度达到了O(N),这是十分不利的,
所以,牛人们又提出了新的数据结构:AVL树(平衡搜索二叉树),给搜索二叉树新增了平衡的特性,控制左右子树的高度,是搜索二叉树处于平衡的状态,避免出现极端情况。
AVL树的发明者是两位俄罗斯数学家G.M.Adelson-Velskii和E.M.Landis,为了几年他们在1962年提出该数据结构,就命名为AVL树。
AVL树的特性
AVL树要求任意节点的左右子树的高度差的绝对值不超过1.
为什么拥有该特性AVL树就可以保持平衡呢?这里需要数学证明,就不解释了,理解原理后,就很容易理解。
一棵AVL树是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
注意:在这里,我们引入一个变量,平衡因子(balance factor),用来记录左右子树的高度差,
这里我们记录右子树的高度减左子树的高度。
当然,也可以有其他的思路来替代平衡因子。
AVL树节点的定义(以KV型为例)
C++
template<class K, class V>
struct AVLTreeNode
{
AVLTreeNode<K,V>* _left = nullptr;//左子节点
AVLTreeNode<K, V>* _right = nullptr;//右子节点
AVLTreeNode<K, V>* _parent = nullptr;//父亲节点
pair<K, V> _kv;//数据
int _bf = 0;//平衡因子
AVLTreeNode(const pair<K, V>& kv)
:_kv(kv)
{}
};
注意:AVL树使用三叉链实现,多了一个parent指针,用来记录父亲节点,方便使用。
AVL树的插入(核心)
AVL树是在搜索二叉树上面进行升级,所以查找的方法和搜索二叉树类似,大了就向右子树走,小了就往左子树走。
因为这里多了parent指针和bf,在插入之后都需要进行维护。(天下没有白吃的午餐,使用的时候方便,维护起来就麻烦了QAQ)
parent指针处理起来很简单,我们这里主要讲bf如何控制。
bf有三种取值 0 , - 1 , 1
当我们在节点的右侧插入的时候,节点的bf++,在节点的左侧插入的时候,节点的bf--。
在右边插入,右子树的高度增加,bf++,在左边插入的时候,左子树的高度增加,bf--
这是毫无疑问的,以下都基于此。
OK,更新完当前节点之后,bf就维护好了吗?
哪有这么简单QAQ
在插入后cur的bf更新为1,仅仅如此吗?
看这张图,parent的bf也要从1变成2了。
所以,在更新完cur节点的bf后,还需要根据情况确定是否要继续向上更新
具体是否要更新,主要是看子树的高度有没有发生变化
有哪些情况呢?
- cur插入后更新为0
说明原来是1 或者 -1,在较短的那一条边上新增了新节点,将cur节点变平衡了,
这样的话,那高度就没有增加,不会影响到子树的高度,就不需要向上更新bf了。- cur插入后更新为 1,-1
说明原来是0,原来是平衡的,插入新节点后破坏了平衡,子树高度发生了变化,
所以需要向上更新bf。- cur插入后更新为 2,-2
当更新为2,-2后,发现违反了AVL树的规则,不再是一颗AVL树,我们就需要进
行特殊操作来维护AVL树的性质了。(这里,我们采用旋转)
AVL树的旋转(最难的部分)
AVL树的旋转是AVL树这个数据结构的亮点,掌握了这一点之后,才会理解这种数据结构有多么精妙。
从深层上看,AVL树的旋转分为四种情况,我们画图来分析。(由于实际情况太多太多,我们这里画抽象图)
左单旋
这里h >= 0
我们在最右边插入一个节点,使AVL树的右侧完全倾斜,那么我们就需要向左侧旋转了。
如何向左旋转呢?
我们将三个需要用到的节点命名一下,分别为parent,subR,以及subRL
根据搜索二叉树的性质,我们知道subRL > parent ,但是小于subR,所以就可以进行左单旋而不会破坏搜索的性质
左单旋就是
先将subRL插入到parent的右边
接着将parent插入到subR的左边
成功旋转之后图形变成下面的样子
这样左右子树的高度就一样了,重新将AVL树调整平衡了
这里还有非常多的代码细节,例如空指针,parent指针的维护等等需要处理,这里大家可以先尝试根据思路写出代码,再跟后面的代码进行比较,看看是否写对了。
这里只简单讲一下平衡因子的维护。
可以看到,在左单旋只会影响parent和subR两个节点的bf,且旋转后皆为0,故不用向上继续调整。
右单旋
右单旋和左单旋类似,是对称的,这里只简单画出抽象图,相信读者能够自己理解。
右单旋就是处理左边完全倾斜的情况,向右边旋转,进而调整平衡。
代码依旧在文末尾给出。
右左双旋
顾名思义,先右单旋后左单旋构成右左双旋。
相信聪明的小伙伴,在看到左单旋和右单旋的时候,就会发现这两种情况都是插入在最右边和最左边造成完全倾斜。
而插入在右子树的左边和左子树的右边都没有列举出来。
这里右左双旋就是应对插入在右子树的左边这种情况的,显然,左右双旋就是应对插入在左子树的右边那种情况的,这里讲右左双旋,左右双旋留给大家自己思考。
左单旋和右单旋都不适合这种情况,根本原因在于,这种情况并不是完全倾斜,很简单嘛,
你不是完全倾斜,我强行让你变成完全倾斜,不就可以使用左单旋或者右单旋了嘛。
对于这种情况,我们可以看到是subRL太高了,导致的不平衡,我们将subRL旋转到subR的位置岂不是可以造成完全倾斜了吗?
这右单旋不就来了嘛,使用右单旋就将subRL的右插入到subR的左,再将subR插入到subRL的右即可。
右单旋完了之后,就是下面的图形
映入眼帘的就是右边太高了,出现了完全倾斜,直接左单旋调整平衡即可。
这里同样有很多代码细节,要维护好parent和bf,以及处理好空指针的特殊情况。
这里还是只简单讲一下bf的维护
我们以终为始,只看旋转前和旋转后的两幅图。
我们可以看到只有三个节点60 30 90的bf发生了变化。
也就是只有parent,subR,subRL三个节点的bf发生了变化。
这里最后subRL和subR的bf 变成了0,parent的bf变成了-1。
但是,一定是这样吗?
这中情况是在c子树上插入新节点,如果在b上插入新节点。
a和b的高度都是h,parent的bf就是0,c的高度是h-1,d的高度是h,subR的bf就是1
问题就在于是在subRL的左子树插入还是右子树插入新节点。
如何分辨?
很简单,去观察subRL的旋转前的bf
如果是1,就是在右子树插入,如果是-1,就是在左子树插入
左右双旋
大体和右左双旋类似,所以这里简单画个抽象图,相信读者能够自行理解。
这里就是新节点插入在了左子树的右边,导致不平衡,先左单旋调整成完全倾斜,在右单旋调整至平衡。
代码
C++
#include <assert.h>
#include <iostream>
using namespace std;
namespace Avltree//命名空间名不能和类名相同,不然会发生命名冲突
{
template<class K, class V>
struct AVLTreeNode
{
AVLTreeNode<K,V>* _left = nullptr;
AVLTreeNode<K, V>* _right = nullptr;
AVLTreeNode<K, V>* _parent = nullptr;
pair<K, V> _kv;
int _bf = 0;//平衡因子
AVLTreeNode(const pair<K, V>& kv)
:_kv(kv)
{}
};
template<class K,class V>
class AVLTree
{
typedef AVLTreeNode<K, V> Node;
private:
Node* _root = nullptr;//开始的时候要给空,不然就是野指针了
void RotateL(Node* parent)//左单旋
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
Node* pparent = parent->_parent;
parent->_right = subRL;
if (subRL)
subRL->_parent = parent;
subR->_left = parent;
if (pparent == nullptr)
{
subR->_parent = nullptr;
_root = subR;
}
else
{
if (pparent->_left == parent)
{
pparent->_left = subR;
}
else
{
pparent->_right = subR;
}
subR->_parent = pparent;
}
parent->_bf = 0;
subR->_bf = 0;
}
void RotateR(Node* parent)//右单旋
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
Node* pparent = parent->_parent;
parent->_left = subLR;
if (subLR)
subLR->_parent = parent;
subL->_right = parent;
if (pparent == nullptr)
{
subL->_parent = nullptr;
_root = subL;
}
else
{
if (pparent->_left == parent)
{
pparent->_left = subL;
}
else
{
pparent->_right = subL;
}
subL->_parent = pparent;
}
parent->_bf = 0;
subL->_bf = 0;
}
void RotateRL(Node* parent)
{
RotateR(parent->_right);
RotateL(parent);
}
void RotateLR(Node* parent)
{
RotateL(parent->_left);
RotateR(parent);
}
void InOrder(Node* root)
{
if (root == nullptr)
return;
InOrder(root->_left);
cout << root->_kv.first << ":" << root->_kv.second << endl;
InOrder(root->_right);
}
public:
void inorder()
{
InOrder(_root);
}
bool find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (key > cur->_kv.first)
{
cur = cur->_right;
}
else if (key < cur->_kv.first)
{
cur = cur->_left;
}
else
{
return true;
}
}
return false;
}
bool insert(const pair<K, V>& kv)
{
if (_root == nullptr)//插入的时候要特殊处理空树
{
_root = new Node(kv);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (kv.first > cur->_kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (kv.first < cur->_kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;//如果已经在,那就插入失败,返回false
}
}
//找到了,开始插入;
cur = new Node(kv);
cur->_parent = parent;
if (kv.first > parent->_kv.first)//插入的节点很大,插在右边
{
parent->_bf++;
parent->_right = cur;
}
else
{
parent->_bf--;
parent->_left = cur;
}
//插入完成,调整平衡因子;
while (parent)
{
if (parent->_bf == 0)
{
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
//开始旋转
if (parent->_bf == 2 && cur->_bf == 1)//右边太高了,左单旋
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)//左边太高了,右单旋
{
RotateR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1)//右边高,但是偏了
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateRL(parent);
if (bf == 0)
{
parent->_bf = subR->_bf = subRL->_bf = 0;
}
else if (bf == 1)
{
subRL->_bf = subR->_bf = 0;
parent->_bf = -1;
}
else if(bf == -1)
{
subRL->_bf = parent->_bf = 0;
subR->_bf = 1;
}
else
{
assert(false);
}
}
else if (parent->_bf == -2 && cur->_bf == 1)//左边高但是偏向右边
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
int bf = subLR->_bf;
RotateLR(parent);
if (bf == 0)
{
parent->_bf = subL->_bf = subLR->_bf = 0;
}
else if (bf == 1)
{
subL->_bf = -1;
parent->_bf = subLR->_bf = 0;
}
else if(bf == -1)
{
subLR->_bf = subL->_bf = 0;
parent->_bf = 1;
}
else
{
assert(false);
}
}
}
else
{
assert(false);//走到这里来就出现错误了
}
}
return true;
}
};
}
对于AVL树的删除,和插入类似,但是更加复杂些,限于篇幅,就暂且不讲AVL树的删除了,感兴趣的读者可以参考《算法导论》和《数据结构(用面向对象方法与C++语言描述)》(殷人昆版)。