二叉搜索树全解：理论剖析、代码实现与场景应用

❤️@燃于AC之乐来自重庆计算机专业的一枚大学生

✨专注 C/C++ Linux 数据结构算法竞赛 AI

🏞️志同道合的人会看见同一片风景！

👇点击进入作者专栏：

《算法画解》✅

《linux系统编程》✅

《C++》✅

🌟《算法画解》算法相关题目点击即可进入实操🌟

感兴趣的可以先收藏起来，请多多支持，还有大家有相关问题都可以给我留言咨询，希望希望共同交流心得，一起进步，你我陪伴，学习路上不孤单！

文章目录

前言（整理学习蓝图）
一、概念
二、性能分析
三、基础接口实现：
- 模板定义与中序遍历
- [3.1 二叉树的插入（insert）](#3.1 二叉树的插入（insert）)
- [3.2 二叉搜索树的查找（find）](#3.2 二叉搜索树的查找（find）)
四、进阶接口------删除（erase）实现
- [4.1 对4种情况分析](#4.1 对4种情况分析)
- [4.2 代码实现](#4.2 代码实现)
五、测试用例及结果
六、二叉搜索树key和key/value使用场景
- [5.1 基于关键码 key 的搜索场景](#5.1 基于关键码 key 的搜索场景)
- [5.2 基于关键码 key/value 的搜索场景：](#5.2 基于关键码 key/value 的搜索场景：)

前言（整理学习蓝图）

容器，置物之所也，根据"数据在容器中的排列特性"，容器可分为序列式（sequence） 和 关联式（associative） 两种:

前几章的学习，已完成了大部分对序列式容器的深入讲解，现在将进入到关联式容器的学习。

关联式容器：数据（每个元素）都有一个键值（key）和一个实值（value）。

当元素被插入到关联式容器中时，容器内部结构（可能是RB-tree，也可能是hash-table）便依照其键值大小，以某种特定规则将这个元素放置于适当位置。关联式容器没有所谓头尾（只有最大元素和最小元素） ，所以不会有所谓
push_back()、push_front()、pop_back()、pop_front()、begin()、end() 这样的操作行为。

一般而言，关联式容器的内部结构是一个balanced binary tree（平衡二叉树），以便获得良好的搜寻效率。balanced

binary tree有许多种类型，包括AVL-tree、RB-tree,AA-tree.

其中，被STL使用得最广泛的就是红黑树（RB-tree）。

由于后面要学的map,set都是要以一种平衡二叉树（blanced binary tree），红黑树为轮子，我们先引入最基础的二叉搜索树（binary search tree），先了解大的框架，循序渐进，由浅入深的学习是一个比较好的过程。

一、概念

⼆叉搜索树（binary search tree）又称⼆叉排序树，它可以是空树，也可以是具有以下性质的⼆叉树:

若它的左子树不为空，则左子树上所有结点的值都小于等于根结点的值

若它的右子树不为空，则右子树上所有结点的值都大于等于根结点的值

它的左右子树也分别为⼆叉搜索树

⼆叉搜索树中可以支持插入相等的值，也可以不支持插入相等的值，具体看使用场景定义，后续我们学习map/set/multimap/multiset系列容器底层就是⼆叉搜索树，其中map/set不支持插入相等值，multimap/multiset支持插入相等值。

二、性能分析

查找：

二叉搜索树可以提供对数时间的元素插入和访问，但是会受到节点大小的分布限制,如下：

这样的效率显然无法满足实际需求。因此，后续课程将继续讲解二叉搜索

树的优化结构------平衡二叉搜索树AVL树和红黑树，它们适用于在内存中

高效地存储和查询数据。

需要补充的是，二分查找虽然也能达到 O(log₂N) 的查找效率，但其存在两

个显著缺陷：

数据必须存储在支持随机访问且有序的结构中；

插入和删除效率低，由于依赖顺序存储，增删数据往往需要移动大量元

素。

这也正是平衡二叉搜索树的重要价值所在。

三、基础接口实现：

模板定义与中序遍历

cpp 复制代码

template<class K>
struct BSTNode
{
	K _key;
	BSTNode<K>* _left;
	BSTNode<K>* _right;
	BSTNode(const K& key)
		:_key(key)
		, _left(nullptr)
		, _right(nullptr)
	{}
};

//binary search tree  key
template<class K>
class BSTree
{
	//typedef BSTNode<K> Node;
	//C++11
	using Node = BSTNode<K>;

public:
	//类里面递归的写法：
	//root私有，外部无，公开在成员函数中暴露
	void InOrder()
	{
		_InOrder(_root); //*this
		cout << endl;
	}

private:
	void _InOrder(Node* root)
	{
		if (root == nullptr)
		{
			return;
		}

		_InOrder(root->_left);
		cout << root->_key << " ";
		_InOrder(root->_right);
	}

private:
	Node* _root = nullptr;
};

3.1 二叉树的插入（insert）

1.树为空，新增节点赋值给root指针；

2.树不空，按⼆叉搜索树性质，插入值比当前节点大往右走，插入值比当前节点小往左走，找到空位置，插入新节点。

3.支持插入等值（左右走规则要一致）或者不支持（这里实现）。

cpp 复制代码

bool Insert(const K& key)
{
	if (_root == nullptr)
	{
		_root = new Node(key);
		return true;
	}
	//记录父节点，用于插入
	Node* parent = nullptr;
	Node* cur = _root;

	//空即为插入位置,这里不考虑等于情况
	while (cur)
	{
		if (cur->_key < key)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_key > key)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;
		}
	}

	cur = new Node(key);
	if (parent->_key < key)
	{
		parent->_right = cur;
	}
	else
	{
		parent->_left = cur;
	}
	return true;
}

3.2 二叉搜索树的查找（find）

1.从根开始比较，查找x，x比根的值大则往右边走查找，x比根值小则往左边走查找。

2.最多查找高度N次，走到到空，还没找到，这个值不存在。

3.如果不支持插入相等的值，找到x即可返回

4.如果支持插入相等的值，意味着有多个x存在，⼀般要求查找中序的第⼀个x。（这里实现的是不支持相等值）

cpp 复制代码

bool Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_key < key)
		{
			cur = cur->_right;
		}
		else if (cur->_key > key)
		{
			cur = cur->_left;
		}
		else
		{
			return true;
		}
	}
	return false;
}

四、进阶接口------删除（erase）实现

对于二叉搜索树的erase接口实现才是一大难点，在力扣的题目中也考察过，非常的重要。

4.1 对4种情况分析

首先查找元素是否纯在，不存在返回false,其次大致要分为四种情况：

要删除结点 N 左右孩子均为空

解决方案：

把 N 结点的父亲对应孩子指针指向空，直接删除 N 结点（情况 1 可以当成 2 或者 3 处理，效果是一样的）
要删除的结点 N 左孩子为空，右孩子结点不为空

解决方案：

把 N 结点的父亲对应孩子指针指向 N 的右孩子，直接删除 N 结点。
要删除的结点 N 右孩子为空，左孩子结点不为空

解决方案：

把 N 结点的父亲对应孩子指针指向 N 的左孩子，直接删除 N 结点。
要删除的结点 N 左右孩子结点均不为空

解决方案：

无法直接删除 N 结点，因为 N 的两个孩子无处安放，只能用替换法删除 。找 N 左子树的值最大结点 R（最右结点）或者 N 右子树的值最小结点 R（最左结点）替代 N（这里使用 N 右子树的值最小结点 R最左结点），因为这两个结点中任意一个，放到 N 的位置，都满足二叉搜索树的规则。替代 N 的意思就是 N 和 R 的两个结点的值交换，转而变成删除 R 结点，R 结点符合情况 2 或情况 3，可以直接删除。

4.2 代码实现

cpp 复制代码

bool Erase(const K& key)
{
	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_key < key)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_key > key)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			//情况123（0-1个孩子）
			if (cur->_left == nullptr) //左为空
			{
				if (cur == _root)
				{
					_root = cur->_right;
				}
				else
				{
					if (parent->_left == cur)
					{
						parent->_left = cur->_right;
					}
					else
					{
						parent->_right = cur->_right;
					}
				}
				delete cur;
			}

			else if (cur->_right == nullptr) //右为空
			{
				if (cur == _root)
				{
					_root = cur->_left;
				}
				else
				{
					if (parent->_left == cur)
					{
						parent->_left = cur->_left;
					}
					else
					{
						parent->_right = cur->_left;
					}
				}
				delete cur;
			}

			else //左右都不为空
			{
				//找替代节点(这里用右子树的最左节点)
				Node* replace = cur->_right;
				//Node* replaceParent = nullptr; 这里不能给空，有右边第一个就是
				//右边最左的情况，就不会进入循环更新父节点，而父节点不为空
				Node* replaceParent = cur;
				while (replace->_left)
				{
					replaceParent = replace;
					replace = replace->_left;
				}

				cur->_key = replace->_key;

				if (replaceParent->_left == replace)
					replaceParent->_left = replace->_right;
				else
					replaceParent->_right = replace->_right;
				delete replace;
			}
			return true;
		}
	}
	return false;
}

五、测试用例及结果

cpp 复制代码

#include "BST.h"

int main()
{
	key::BSTree<int> t;
	int a[] = { 8, 3, 1, 10, 1, 6, 4, 7, 14, 13 };
	for (auto e : a)
	{
		t.Insert(e);
	 }

	t.InOrder();
	t.Insert(16);
	t.InOrder();

	t.Insert(3);
	t.InOrder();

	t.Erase(3);
	t.InOrder();

	t.Erase(8);
	t.InOrder();

	for (auto e : a)
	{
		t.Erase(e);
		t.InOrder();
	}
	
	return 0;
}