数据结构笔记——数据结构与时间复杂度

一、数据结构与算法复杂度基础

本节分为两大模块:数据结构存在的意义、算法效率评判标准(时间复杂度 + 大 O 表示法)。

1. 数据结构的存在意义

(1)核心作用:解决大规模数据管理问题

类比图书馆书籍分类: 无规则乱序存放书籍,找书需要一本一本遍历;分类编号存放后,可快速定位。 数据结构同理:对海量数据做规范化存储组织,优化查找、插入、删除、修改操作效率。

(2)适用场景边界

数据结构性能差距只体现在大规模数据场景(海量磁盘数据、百万级内存数据); 少量数据(仅 10 条以内)计算机硬件性能充足,不同数据结构的效率差异可以忽略。

2. 算法效率评估标准:时间复杂度

(1)时间复杂度定义

不依赖电脑 CPU、内存等硬件性能,抛弃 "实际运行毫秒数"; 以代码执行次数 为衡量标准,描述算法执行耗时随数据量n增长的变化趋势。

(2)大 O 表示法(复杂度分析核心规则)

只保留函数最高阶项,直接忽略常数、低次项:

  • 常数项全部删掉,如 2n+100 → 只保留 n
  • 低阶项全部删掉,如 n²+3n → 只保留

常见阶释义:

  • O(1):常数阶,执行次数固定,和数据量无关
  • O(log n):对数阶,数据量翻倍,执行次数仅 + 1
  • O(n):线性阶,数据量扩大几倍,执行次数同步扩大几倍
  • O(n²):平方阶,数据量翻倍,耗时成倍暴涨

(3)复杂度优劣排序(效率从高到低)

O(1) > O(log n) > O(n) > O(n²) O(1) 为最优复杂度,是开发中优先追求的性能标准。

二、核心数据结构查找操作时间复杂度汇总

1. 线性结构:数组 & 单链表

无序数组

无任何排序规则,查找目标只能从头遍历到尾,平均遍历一半元素

查找复杂度:O(n)

有序数组

数据升序 / 降序排列,可使用二分查找,每次过滤一半数据

查找复杂度:O(log n)

单链表

内存地址不连续,依靠指针串联节点; 无论链表是否有序,都必须从头节点逐个向后遍历,无法使用二分查找。

查找复杂度:O(n)

2. 哈希表 HashTable

底层结构

数组 + 链表 / 红黑树结合;通过哈希函数(取模、哈希算法)把 key 映射为数组下标,理论上一步定位。

理想无冲突时存取复杂度:O(1)

哈希冲突解决方案

不同 key 算出相同下标,产生冲突:

  1. 拉链法:下标位置挂载链表存放冲突数据
  2. JDK8 优化:链表长度超过阈值自动转为红黑树,保证冲突场景下查找效率稳定 O(log n)

3. 树形结构:二叉搜索树 & 平衡树

普通二叉搜索树 BST

规则:左子树全部小于根节点,右子树全部大于根节点。 树完全平衡时,查找层数为 logn

理想平衡:O(log n)

缺陷:如果插入有序数据,二叉树会退化成单链,复杂度直接退化至 O(n)

平衡二叉树(AVL 树、红黑树)

通过左旋、右旋等平衡操作,强制维持树左右高度差稳定; 杜绝退化成链表的问题,增删查操作复杂度稳定 O(log n)

三、经典算法复杂度数学推导实例

1. 二分查找 O (log n) 推导

假设总数据量为n,每次二分后数据减半; 经过k次二分后剩余 1 个元素,公式: 2kn​=1 变形得:2k=n,转换对数 k=log2​n 循环执行次数等于k,因此时间复杂度:O(log n)

2. 平衡二叉树查找 O (log n) 推导

满二叉树规律:第 k 层最多存放 2k−1 个节点; 整棵树总节点总数: n=2k−1 数据量大时常数 1 可忽略,简化为 n≈2k 变形:k=log2​n 查找最多遍历树的全部层数 k,因此复杂度:O(log n)