数据结构笔记——数据结构与时间复杂度

一、数据结构与算法复杂度基础

本节分为两大模块：数据结构存在的意义、算法效率评判标准（时间复杂度 + 大 O 表示法）。

类比图书馆书籍分类：无规则乱序存放书籍，找书需要一本一本遍历；分类编号存放后，可快速定位。数据结构同理：对海量数据做规范化存储组织，优化查找、插入、删除、修改操作效率。

数据结构性能差距只体现在大规模数据场景（海量磁盘数据、百万级内存数据）；少量数据（仅 10 条以内）计算机硬件性能充足，不同数据结构的效率差异可以忽略。

不依赖电脑 CPU、内存等硬件性能，抛弃 "实际运行毫秒数"；以代码执行次数 为衡量标准，描述算法执行耗时随数据量n增长的变化趋势。

只保留函数最高阶项，直接忽略常数、低次项：

常见阶释义：

O(1) > O(log n) > O(n) > O(n²) O(1) 为最优复杂度，是开发中优先追求的性能标准。

无任何排序规则，查找目标只能从头遍历到尾，平均遍历一半元素

查找复杂度：O(n)

数据升序 / 降序排列，可使用二分查找，每次过滤一半数据

查找复杂度：O(log n)

内存地址不连续，依靠指针串联节点；无论链表是否有序，都必须从头节点逐个向后遍历，无法使用二分查找。

查找复杂度：O(n)

数组 + 链表 / 红黑树结合；通过哈希函数（取模、哈希算法）把 key 映射为数组下标，理论上一步定位。

理想无冲突时存取复杂度：O(1)

不同 key 算出相同下标，产生冲突：

规则：左子树全部小于根节点，右子树全部大于根节点。树完全平衡时，查找层数为 logn

理想平衡：O(log n)

缺陷：如果插入有序数据，二叉树会退化成单链，复杂度直接退化至 O(n)。

通过左旋、右旋等平衡操作，强制维持树左右高度差稳定；杜绝退化成链表的问题，增删查操作复杂度稳定 O(log n)。

假设总数据量为n，每次二分后数据减半；经过k次二分后剩余 1 个元素，公式： 2kn=1 变形得：2k=n，转换对数 k=log2n 循环执行次数等于k，因此时间复杂度：O(log n)

满二叉树规律：第 k 层最多存放 2k−1 个节点；整棵树总节点总数： n=2k−1 数据量大时常数 1 可忽略，简化为 n≈2k 变形：k=log2n 查找最多遍历树的全部层数 k，因此复杂度：O(log n)