【小白笔记】稀疏数组 (Sparse Array) 在计算机科学中的存储优化问题

稀疏数组 (Sparse Array) 在计算机科学中的存储优化 问题。使用字典(Python 中的 dict)来存储稀疏数组的方法,通常被称为坐标列表法 (Coordinate List, COO)字典键值对法


🧐 稀疏数组 (Sparse Array) 是什么?

术语解释:

  • 数组 (Array): 一种数据结构,用于存储固定大小的、相同类型元素的集合。在数学和编程中,通常指矩阵(Matrix)或向量(Vector)。
  • 稀疏 (Sparse): 英文单词 Sparse (adj.) 意为"稀疏的、零星的、贫乏的"。
    • 词源:来源于拉丁语 sparsus,意为"散布的、分散的"。
  • 稀疏数组 (Sparse Array / Sparse Matrix):
    • 指数组(特别是二维数组/矩阵 )中绝大多数 元素的值都是(或某个默认值)的情况。

为什么需要优化?

对于一个 1000×10001000 \times 10001000×1000 的矩阵,如果其中只有 10 个非零元素,但您仍然用 1000×1000=1001000 \times 1000 = 1001000×1000=100 万个位置来存储它,这会造成巨大的内存浪费


💡 字典存储法:用 [i, j] 做 Key 是什么意思?

"用 [i, j] 做 key" 的意思是:我们不存储所有 元素,而只存储那些非零元素。

1. 存储结构

这种方法使用一个 Python 字典 (Dictionary) 来存储数据,其结构如下:

Dictionary={Key:Value}\text{Dictionary} = \{ \text{Key} : \text{Value} \}Dictionary={Key:Value}

在这种稀疏存储法中:

  • Key (键): 数组中非零元素坐标 ,即它的行索引 iii列索引 jjj 。在 Python 中,通常用元组 (Tuple) (i, j) 来表示键,因为元组是不可变的,可以作为字典的键。
  • Value (值): 位于该坐标 (i, j) 上的非零元素的值

2. 实际操作示例

假设有一个 3×33 \times 33×3 的稀疏矩阵 AAA:

A=(050000−200) A = \begin{pmatrix} 0 & 5 & 0 \\ 0 & 0 & 0 \\ -2 & 0 & 0 \end{pmatrix} A= 00−2500000

传统存储 (浪费内存): 需要 3×3=93 \times 3 = 93×3=9 个内存单元。

字典存储法 (内存优化): 只存储两个非零元素的位置和值:

sparse_dict={(0,1):5,(2,0):−2}\text{sparse\_dict} = \{ (0, 1) : 5, \quad (2, 0) : -2 \}sparse_dict={(0,1):5,(2,0):−2}

解读:

  • (0, 1) 表示:第 0 行,第 1 列的元素。
  • 5 表示:该位置上的值是 5。
  • 如果想知道 (1, 2) 位置的值,只需查询字典中没有 这个键,那么默认值就是 000。

3. 核心优势

  • 节省内存: 内存消耗只与非零元素 的数量成正比,而不是与矩阵的总大小成正比。
  • 快速查找: 由于使用了字典的哈希表结构,查找一个特定位置 (i, j) 的时间复杂度接近 O(1)O(1)O(1) (常数时间),非常快。

术语解释:

  • 字典 (Dictionary): Python 中的核心数据结构,存储键值对 (Key-Value Pairs)。
  • 哈希表 (Hash Table): 专业术语 。字典内部实现的数据结构,通过哈希函数 (Hash Function) 将键映射到存储位置,以实现快速的查找、插入和删除操作。

总而言之,用 (i, j) 做 Key 存入字典,是一种高效空间友好的稀疏数组存储技术,核心思想是"只记录非零数据的位置和值"。

相关推荐
晓梦.6 小时前
Vue3学习笔记
笔记·学习
思成不止于此6 小时前
【MySQL 零基础入门】DQL 核心语法(二):表条件查询与分组查询篇
android·数据库·笔记·学习·mysql
SadSunset7 小时前
(15)抽象工厂模式(了解)
java·笔记·后端·spring·抽象工厂模式
hd51cc8 小时前
MFC控件 学习笔记二
笔记·学习·mfc
Jack___Xue10 小时前
LangChain实战快速入门笔记(二)--LangChain使用之Model I/O
笔记·langchain
遇到困难睡大觉哈哈11 小时前
HarmonyOS —— Remote Communication Kit 拦截器(Interceptor)高阶定制能力笔记
笔记·华为·harmonyos
风123456789~11 小时前
【健康管理】第12章 健康信息学 2/2
笔记·考证·健康管理
hetao173383711 小时前
2025-12-11 hetao1733837的刷题笔记
c++·笔记·算法
kkkkkkkkk_120111 小时前
【强化学习】06周博磊强化学习纲要学习笔记——第三课下
笔记·学习·强化学习