数据结构入门:哈希表和树结构

一、排序 + 二分查找:基于有序结构的高效查找

1.1. 基本流程

对于无序数据集,先通过排序将其转化为有序结构,再利用二分查找实现高效查询:

排序阶段:采用时间复杂度为 O(nlogn) 的算法(如快速排序、归并排序),将数据集调整为有序序列。

查找阶段:二分查找通过 "分治" 思想,每次排除一半数据,时间复杂度为 O(logn)。

1.2. 示例

以数据集 [5,7,4,2,0,3,1,6] 为例:

  1. 排序后得到有序序列 [0,1,2,3,4,5,6,7]
  2. 查找元素 4
    • 初始区间 [0,7],中间元素为 3(小于 4),缩小到右区间 [4,7]
    • 中间元素为 5(大于 4),缩小到左区间 [4,4],找到目标元素。

1.3. 局限性

排序操作的开销较高,若数据集频繁增删,需重复排序,整体效率下降。

二、哈希表:O (1) 级别的存储与查找

2.1. 核心原理

哈希表通过哈希函数将数据映射到数组的指定索引(即 "桶"),实现直接访问:

哈希函数:常见实现为 value % 数组长度(需保证数组长度为质数以减少冲突);

理想情况下,插入、查找、删除操作的时间复杂度均为 O(1)。

2.2. 哈希冲突及解决

当不同数据映射到同一索引时,会发生 "哈希冲突",常用拉链法解决:将冲突元素以链表 / 树的形式存储在同一桶下。

2.3. 示例

以数组长度为 10 的哈希表存储数据 42,33,5,96

42%10=2 → 存入索引 2;

33%10=3 → 存入索引 3;

若存入 9(9%10=9),后续存入 19 时发生冲突,将 19 链入索引 9 的链表中。

三、树结构:动态数据的高效分层存储

当数据量较大且需频繁增删时,树结构通过分层组织数据,平衡存储与查询效率。

3.1. 二叉排序树(BST)

3.1.1.定义

二叉排序树满足:左子树所有节点值 < 父节点值 < 右子树所有节点值。

3.1.2.操作复杂度

理想情况下(树结构平衡),插入、查找、删除的时间复杂度为 O(logn);

若数据有序,BST 会退化为单链表,操作复杂度劣化为 O(n)。

3.1.3.示例

存储数据集 [5,3,1,4,8,9,7] 的 BST 结构:

java 复制代码
    5
   / \
  3   8
 / \ / \
1  4 7  9

3.2. 平衡二叉树(AVL 树)

为解决 BST 的退化问题,AVL 树通过平衡因子(左右子树高度差的绝对值)限制树的形态:

平衡因子需 ≤ 1;

当插入 / 删除导致失衡时,通过旋转操作调整结构:

LL/RR 旋转:单方向失衡时,将中间节点提升为父节点;

LR/RL 旋转:双向失衡时,先调整子树方向,再执行单旋转。

AVL 树的操作复杂度稳定为 O(logn),但旋转操作开销较高。

3.3. 红黑树

红黑树通过颜色规则维持近似平衡,降低调整频率:

  1. 红黑树的节点颜色不是红色就是黑色的;
  2. 根节点与叶子节点都为黑色;
  3. 如果一个节点是红色的,那么他的子节点必为黑色;
  4. 从根节点出发到任意一个叶子节点,所走过的路径上黑色节点的数目是相同的

红黑树的最长路径不超过最短路径的 2 倍,操作复杂度为 O(logn),是工程中常用的高效结构(如 Java 的 TreeMapHashMap)。

相关推荐
汀、人工智能6 分钟前
[特殊字符] 第57课:搜索旋转排序数组
数据结构·算法·数据库架构·图论·bfs·搜索旋转排序数组
倦王11 分钟前
力扣日刷47
算法·leetcode·职场和发展
MicroTech202513 分钟前
突破量子数据加载瓶颈,MLGO微算法科技推出面向大规模量子计算的分治态制备技术
科技·算法·量子计算
码王吴彦祖15 分钟前
顶象 AC 纯算法迁移实战:从补环境到纯算的完整拆解
java·前端·算法
SccTsAxR19 分钟前
算法基石:手撕离散化、递归与分治
c++·经验分享·笔记·算法
wuweijianlove20 分钟前
算法测试中的数据规模与时间复杂度匹配的技术4
算法
Q741_1471 小时前
每日一题 力扣 3655. 区间乘法查询后的异或 II 模拟 分治 乘法差分法 快速幂 C++ 题解
c++·算法·leetcode·模拟·快速幂·分治·差分法
The_Ticker1 小时前
印度股票实时行情API(低成本方案)
python·websocket·算法·金融·区块链
夏乌_Wx1 小时前
剑指offer | 2.4数据结构相关题目
数据结构·c++·算法·剑指offer·c/c++
AI成长日志2 小时前
【笔面试算法学习专栏】哈希表基础:两数之和与字母异位词分组
学习·算法·面试