一、树的基本概念
树是一种非线性数据结构,由n(n≥0)个节点组成,类比现实中的树,包含根、枝干和叶子。当n=0时为空树;n≥1时,有且仅有一个根节点(无父节点),其余节点可分为若干个互不相交的子集,每个子集都是一棵独立的子树。树的核心术语包括:父节点(直接上层节点)、子节点(直接下层节点)、兄弟节点(同一父节点的子节点)、叶子节点(无子女的节点)、节点的度(子节点个数)、树的深度(从根到最远叶子的层数,根为第1层)、树的高度(从叶子到根的最大层数)、路径(从根到某节点的节点序列)。
二、树的核心特性
-
根节点唯一,无父节点,其余节点有且仅有一个父节点;
-
节点间通过父子关系连接,不存在环路(否则为图结构);
-
树的子树互不相交,任意两个节点间有且仅有一条路径;
-
树的层次结构体现了"一对多"的逻辑关系,区别于线性结构的"一对一"。
三、常见树的类型
- 二叉树(最常用)
每个节点最多有两个子节点,分别称为左子树和右子树,子树有左右顺序之分(不可交换)。二叉树的特殊形态包括:
• 满二叉树:除叶子节点外,每个节点都有两个子节点,且叶子节点在同一层;
• 完全二叉树:按层序遍历(从上到下、从左到右)填充节点,除最后一层外,每一层节点数均为最大值,最后一层节点集中在左侧(右侧可空缺);
• 斜树:所有节点都只有左子树(左斜树)或右子树(右斜树),本质等同于线性结构。
- 其他常见树
• 二叉搜索树(BST):左子树所有节点值<根节点值,右子树所有节点值>根节点值,支持高效的查找、插入、删除操作(理想情况时间复杂度O(logn));
• 平衡二叉树(AVL树):二叉搜索树的优化版,任意节点的左右子树高度差绝对值≤1,避免斜树导致的O(n)复杂度;
• 红黑树:一种自平衡二叉搜索树,通过颜色规则(红/黑节点)维持平衡,插入删除效率高于AVL树,常用于Java的TreeMap、C++的std::map;
• 多叉树:节点可以有多个子节点,典型例子是B树(多路平衡查找树),常用于数据库索引;
• 哈夫曼树(最优二叉树):带权路径长度最短的二叉树,用于哈夫曼编码(数据压缩)。
四、树的遍历方式(以二叉树为例)
遍历核心是按一定顺序访问所有节点,二叉树有四种基础遍历方式,均基于递归或迭代实现:
-
前序遍历(根-左-右):先访问根节点,再递归遍历左子树,最后递归遍历右子树;
-
中序遍历(左-根-右):先递归遍历左子树,再访问根节点,最后递归遍历右子树(二叉搜索树的中序遍历结果为有序序列);
-
后序遍历(左-右-根):先递归遍历左子树,再递归遍历右子树,最后访问根节点;
-
层序遍历(广度优先):按树的层次从上到下、同一层从左到右依次访问节点,需借助队列实现。
五、树的应用场景
• 数据存储与检索:二叉搜索树、红黑树、B树用于高效查找(如数据库索引、集合框架);
• 层级关系表示:文件系统(目录树)、组织架构图、XML/HTML文档结构;
• 算法优化:哈夫曼编码(数据压缩)、决策树(机器学习)、广度优先搜索(BFS)/深度优先搜索(DFS)的底层结构;
• 其他:前缀树(字典树,用于字符串匹配)、线段树(区间查询与更新)。