数据结构-哈希表

哈希表通常是基于数组进行实现的,但是对于数组,它有很多优势。
相对于数组的优势

  • 哈希表可以提供非常快速的插入-删除-查找操作。
  • 无论多少数据,插入和删除值需要接近常量的时间:即O(1)。
  • 哈希表的速度比树还要快,基本可以瞬间查找到想要的元素
  • 哈希表相对于树来说编码要容易很多。

相对于数组的不足

  • 哈希表中的数据是无序的,所以不能以一种固定的方式来遍历其中的元素。
  • 通常情况下哈希表的KEY是不允许重复的,不能放置相同的key,用于保存不同的元素。

哈希表不像数组、链表和树一样,直接画出来就知道他的结构,甚至原理。

他的结构就是数组,但是他神奇的地方在于对下标值的一种变换,这种变换可以称之为哈希函数,通过哈希函数可以获取到HashCode。

哈希表的原理

  • 哈希化:将大数字转化为数组范围内下标的过程,称之为哈希化
  • 哈希函数:通常将单词转换为大数字(幂*),大数字在进行哈希化的代码实现放在一个函数中,这个函数称之为哈希函数
  • 哈希表:最终将数据插入到的这个数组,对整个结构的封装,称之为一个哈希表

哈希化后下标冲突解决
冲突不会很多

  • 拉链法:数组的每个单元存储链表或者数组,不存储一个数据单元,比如:两个不同输入经过哈希函数计算出的下标都是0,那么以两个数据以数组或者链表的形式存储在数组下标0的数据单元中。
  • 开放地址法:有三种方法,简单来说就是向下找空白单元,三种方法不同之处就是步长不一样。具体不说了,比较复杂,而且还有一些其他问题。以下用拉链法(java 中的hash就是拉链法)

哈希函数

  • 快速的计算:哈希表的优势就在于效率,所以快速获取到对应的hashCode非常重要。我们需要通过快速的计算来获取到元素对应
  • 均匀的分布:哈希表中,无论是链地址法还是开放地址发,当多个元素映射到同一个位置的时候,都会影响效率,所以优秀的哈希函数应该尽可能将元素映射到不同位置,让元素在哈希表中均匀的分布。

java中的HashMap

  • java中的哈希表采用的是链地址法
  • HashMap的初始长度为16,每次自动扩展,长度必须是2的次幂
  • 这是为了服务于从key映射到index的算法
  • HashMap中为了提高效率,采用了位运算的方式,公式:index = HashCode(key) & (length - 1),比如计算'book'的hashcode,结果为十进制的3029737,二进制为1011... 1001,假设hashmap的长度为16,length - 1的结果为十进制的15,二进制的1111,1011... 1001 & 1111 = 1001 ,等于9,所以index = 9
相关推荐
用户0099383143011 小时前
代码随想录算法训练营第十三天 | 二叉树part01
数据结构·算法
shinelord明1 小时前
【再谈设计模式】享元模式~对象共享的优化妙手
开发语言·数据结构·算法·设计模式·软件工程
薄荷故人_1 小时前
从零开始的C++之旅——红黑树及其实现
数据结构·c++
努力学习编程的伍大侠1 小时前
基础排序算法
数据结构·c++·算法
XiaoLeisj2 小时前
【递归,搜索与回溯算法 & 综合练习】深入理解暴搜决策树:递归,搜索与回溯算法综合小专题(二)
数据结构·算法·leetcode·决策树·深度优先·剪枝
Jackey_Song_Odd3 小时前
C语言 单向链表反转问题
c语言·数据结构·算法·链表
乐之者v3 小时前
leetCode43.字符串相乘
java·数据结构·算法
A懿轩A4 小时前
C/C++ 数据结构与算法【数组】 数组详细解析【日常学习,考研必备】带图+详细代码
c语言·数据结构·c++·学习·考研·算法·数组
️南城丶北离5 小时前
[数据结构]图——C++描述
数据结构··最小生成树·最短路径·aov网络·aoe网络
✿ ༺ ོIT技术༻5 小时前
C++11:新特性&右值引用&移动语义
linux·数据结构·c++