【小白笔记】稀疏数组 (Sparse Array) 在计算机科学中的存储优化问题

稀疏数组 (Sparse Array) 在计算机科学中的存储优化 问题。使用字典(Python 中的 dict)来存储稀疏数组的方法,通常被称为坐标列表法 (Coordinate List, COO)字典键值对法


🧐 稀疏数组 (Sparse Array) 是什么?

术语解释:

  • 数组 (Array): 一种数据结构,用于存储固定大小的、相同类型元素的集合。在数学和编程中,通常指矩阵(Matrix)或向量(Vector)。
  • 稀疏 (Sparse): 英文单词 Sparse (adj.) 意为"稀疏的、零星的、贫乏的"。
    • 词源:来源于拉丁语 sparsus,意为"散布的、分散的"。
  • 稀疏数组 (Sparse Array / Sparse Matrix):
    • 指数组(特别是二维数组/矩阵 )中绝大多数 元素的值都是(或某个默认值)的情况。

为什么需要优化?

对于一个 1000×10001000 \times 10001000×1000 的矩阵,如果其中只有 10 个非零元素,但您仍然用 1000×1000=1001000 \times 1000 = 1001000×1000=100 万个位置来存储它,这会造成巨大的内存浪费


💡 字典存储法:用 [i, j] 做 Key 是什么意思?

"用 [i, j] 做 key" 的意思是:我们不存储所有 元素,而只存储那些非零元素。

1. 存储结构

这种方法使用一个 Python 字典 (Dictionary) 来存储数据,其结构如下:

Dictionary={Key:Value}\text{Dictionary} = \{ \text{Key} : \text{Value} \}Dictionary={Key:Value}

在这种稀疏存储法中:

  • Key (键): 数组中非零元素坐标 ,即它的行索引 iii列索引 jjj 。在 Python 中,通常用元组 (Tuple) (i, j) 来表示键,因为元组是不可变的,可以作为字典的键。
  • Value (值): 位于该坐标 (i, j) 上的非零元素的值

2. 实际操作示例

假设有一个 3×33 \times 33×3 的稀疏矩阵 AAA:

A=(050000−200) A = \begin{pmatrix} 0 & 5 & 0 \\ 0 & 0 & 0 \\ -2 & 0 & 0 \end{pmatrix} A= 00−2500000

传统存储 (浪费内存): 需要 3×3=93 \times 3 = 93×3=9 个内存单元。

字典存储法 (内存优化): 只存储两个非零元素的位置和值:

sparse_dict={(0,1):5,(2,0):−2}\text{sparse\_dict} = \{ (0, 1) : 5, \quad (2, 0) : -2 \}sparse_dict={(0,1):5,(2,0):−2}

解读:

  • (0, 1) 表示:第 0 行,第 1 列的元素。
  • 5 表示:该位置上的值是 5。
  • 如果想知道 (1, 2) 位置的值,只需查询字典中没有 这个键,那么默认值就是 000。

3. 核心优势

  • 节省内存: 内存消耗只与非零元素 的数量成正比,而不是与矩阵的总大小成正比。
  • 快速查找: 由于使用了字典的哈希表结构,查找一个特定位置 (i, j) 的时间复杂度接近 O(1)O(1)O(1) (常数时间),非常快。

术语解释:

  • 字典 (Dictionary): Python 中的核心数据结构,存储键值对 (Key-Value Pairs)。
  • 哈希表 (Hash Table): 专业术语 。字典内部实现的数据结构,通过哈希函数 (Hash Function) 将键映射到存储位置,以实现快速的查找、插入和删除操作。

总而言之,用 (i, j) 做 Key 存入字典,是一种高效空间友好的稀疏数组存储技术,核心思想是"只记录非零数据的位置和值"。

相关推荐
摇滚侠7 小时前
Spring Boot3零基础教程,Lambda 表达式与函数式接口,笔记95
java·spring boot·笔记
摇滚侠8 小时前
Spring Boot3零基础教程,Lambda 表达式的使用,笔记96
spring boot·笔记
charlie1145141919 小时前
HTML 理论系统笔记2
前端·笔记·学习·html·基础·1024程序员节·原生
Elias不吃糖9 小时前
Linux 环境适应 Day 1 全面笔记
linux·c++·笔记
爱奥尼欧9 小时前
【Linux笔记】网络部分——传输层协议TCP(1)
linux·运维·网络·笔记·tcp/ip·1024程序员节
Lester_11019 小时前
嵌入式学习笔记 - 用泰勒公式解决 tanh函数
笔记·学习·算法
sunshine~~~9 小时前
【笔记】macOs arm架构安装虚拟机Ubuntu环境:ROS2 + Python开发
arm开发·笔记·python·macos·ros2
在坚持一下我可没意见10 小时前
Java 网络编程:TCP 与 UDP 的「通信江湖」(基于TCP回显服务器)
java·服务器·开发语言·笔记·tcp/ip·udp·java-ee
弈风千秋万古愁10 小时前
【PID】连续PID和数字PID chapter1(补充) 学习笔记
笔记·学习·算法·matlab