MySQL算法篇(一)

Hash算法,也称为哈希算法或散列算法,是一种将任意长度的输入(如文本、图片等)通过某种规则转换成固定长度的输出的算法。这个输出通常被称为哈希值、哈希码或哈希摘要。以下是一些关于哈希算法的关键点:

  1. 不可逆性:理论上,从哈希值不能逆向推导出原始输入数据。

  2. 确定性:对于同一个输入,无论何时何地使用相同的哈希算法,都会得到相同的哈希值。

  3. 快速计算:哈希算法通常设计得非常高效,可以快速计算出哈希值。

  4. 抗冲突性:不同的输入应该产生不同的哈希值,即哈希冲突的概率极低。

  5. 雪崩效应:即使是微小的输入变化,也会导致哈希值的显著不同。

  6. 应用广泛:哈希算法在数据存储、密码学、网络安全、数据完整性验证等领域有广泛应用。

常见的哈希算法包括:

  • MD5(Message-Digest Algorithm 5):一种广泛使用的哈希算法,产生128位的哈希值。但由于已知的安全性问题,MD5已不再推荐用于安全敏感的应用。

  • SHA(Secure Hash Algorithm):一系列哈希函数,包括SHA-1、SHA-2(如SHA-256、SHA-512)和SHA-3。SHA-1已不再被认为是安全的,而SHA-2和SHA-3被广泛认为是安全的。

  • CRC(Cyclic Redundancy Check):一种用于检测数据传输错误的哈希算法。

  • bcrypt:一种专为密码存储设计的哈希算法,它通过使用盐(salt)和多次迭代来增加计算复杂度,从而提高安全性。

  • Argon2:一种密码哈希算法,被认为是更安全的替代bcrypt的选择,赢得了密码哈希竞赛。

  • BLAKE2:一种快速、安全的哈希算法,设计用于替代旧的BLAKE算法。

哈希算法的选择取决于具体的应用场景和安全需求。在安全敏感的应用中,推荐使用那些被认为抗碰撞性更强、更难以被破解的哈希算法。

二叉查找树(Binary Search Tree,简称BST)是一种特殊的二叉树,它具有以下特性:

  1. 有序性:对于树中的任意节点,其左子树上所有节点的值都小于该节点的值,其右子树上所有节点的值都大于该节点的值。

  2. 唯一性:树中的每个节点都有一个唯一的值。

  3. 二叉树结构:每个节点最多有两个子节点,即左子节点和右子节点。

  4. 平衡性:理想情况下,二叉查找树应该是平衡的,即任意两个叶子节点的深度差不超过1。但在最坏情况下,如果插入的元素是有序的,那么树将退化成链表,导致性能下降。

二叉查找树的基本操作包括:

  • 查找(Search):在树中查找一个特定的值。由于树的有序性,查找的时间复杂度可以低至O(log n),最坏情况下为O(n)。

  • 插入(Insert):向树中插入一个新的值。插入操作需要保持树的有序性,时间复杂度平均为O(log n),最坏情况下为O(n)。

  • 删除(Delete):从树中删除一个节点。删除操作相对复杂,需要考虑三种情况:被删除节点没有子节点、有一个子节点、有两个子节点。时间复杂度平均为O(log n),最坏情况下为O(n)。

  • 遍历(Traversal):遍历二叉查找树可以按照不同的顺序访问所有节点,常见的遍历方式有前序遍历、中序遍历、后序遍历和层序遍历。中序遍历二叉查找树可以得到一个有序的节点值序列。

二叉查找树的变种包括:

  • 平衡二叉查找树(Balanced Binary Search Tree):如AVL树和红黑树,它们通过特定的旋转操作保持树的平衡,从而保证操作的时间复杂度始终为O(log n)。

  • B树和B+树:用于数据库和文件系统的多路查找树,可以有多个子节点。

  • 区间查找树(Interval Tree):用于存储区间信息,并快速查询给定区间内的所有点。

二叉查找树是一种非常基础且重要的数据结构,广泛应用于算法和计算机科学领域。

总结

在数据库中,数据的自增是一个很常见的形式,比如一个表的主键是 id,而主键一般默认都是自增的,如果采取二叉树这种数据结构作为索引,那上面介绍到的不平衡状态导致的线性查找的问题必然出现。因此,简单的二叉查找树存在不平衡导致的检索性能降低的问题,是不能直接用于实现 Mysql 底层索引的。

相关推荐
XianxinMao3 小时前
RLHF技术应用探析:从安全任务到高阶能力提升
人工智能·python·算法
hefaxiang3 小时前
【C++】函数重载
开发语言·c++·算法
exp_add34 小时前
Codeforces Round 1000 (Div. 2) A-C
c++·算法
查理零世5 小时前
【算法】经典博弈论问题——巴什博弈 python
开发语言·python·算法
神探阿航5 小时前
第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组
java·算法·蓝桥杯
皮肤科大白5 小时前
如何在data.table中处理缺失值
学习·算法·机器学习
不能只会打代码7 小时前
蓝桥杯例题一
算法·蓝桥杯
OKkankan7 小时前
实现二叉树_堆
c语言·数据结构·c++·算法
ExRoc8 小时前
蓝桥杯真题 - 填充 - 题解
c++·算法·蓝桥杯
利刃大大9 小时前
【二叉树的深搜】二叉树剪枝
c++·算法·dfs·剪枝