数据结构是计算机中组织、存储和管理数据的方式,旨在提高数据操作(如查找、插入、删除)的效率,是算法设计的基础。
一、核心数据结构类型(按逻辑结构分类)
1. 线性结构(数据元素一对一排列)
- 数组(Array):连续内存存储,支持随机访问(通过索引快速定位),但插入 / 删除需移动元素,适用于数据量固定、查询频繁的场景(如存储学生成绩列表)。
- 链表(Linked List):非连续内存存储,通过指针 / 引用连接节点,插入 / 删除效率高(无需移动元素),但查询需遍历,适用于数据动态增减、查询较少的场景(如链表式队列)。
- 栈(Stack):"先进后出"(LIFO)结构,仅允许在栈顶操作(压栈 / 弹栈),适用于括号匹配、函数调用栈、表达式求值等场景。
- 队列(Queue):"先进先出"(FIFO)结构,允许在队尾插入、队头删除,适用于任务调度、消息队列、广度优先搜索(BFS)等场景。
2. 非线性结构(数据元素一对多 / 多对多排列)
- 树(Tree) :层级结构,有且仅有一个根节点,子节点间无关联,适用于有序数据存储与查询。常见子类:
- 二叉树:每个节点最多 2 个子节点(左 / 右子树);
- 二叉搜索树(BST):左子树值<根节点值<右子树值,支持高效查询(理想时间复杂度 O (logn));
- 堆(Heap):完全二叉树,分为大顶堆(根节点最大)和小顶堆(根节点最小),适用于优先级队列、Top-K 问题。
- 图(Graph):由顶点(Vertex)和边(Edge)组成,可表示多对多关系,分为有向图(边有方向)和无向图(边无方向),适用于社交网络、路径规划(如最短路径算法 Dijkstra)等场景。
- 哈希表(Hash Table):通过哈希函数将键(Key)映射到内存地址,实现 "键 - 值" 快速查找(理想时间复杂度 O (1)),但需处理哈希冲突(如链地址法、开放定址法),适用于缓存、字典(如 Python 的 dict)等场景。
二、数据结构的核心作用
- 优化效率:通过合理选择结构减少时间 / 空间开销(如用哈希表替代数组实现快速查找);
- 支撑算法:所有算法均依赖数据结构实现(如排序算法需基于数组 / 链表,图算法需基于图结构);
- 解决实际问题:针对不同场景匹配最优结构(如用树存储文件系统目录,用队列处理任务排队)