数据结构-哈希表

哈希表通常是基于数组进行实现的，但是对于数组，它有很多优势。
相对于数组的优势

相对于数组的不足

哈希表不像数组、链表和树一样，直接画出来就知道他的结构，甚至原理。

他的结构就是数组，但是他神奇的地方在于对下标值的一种变换，这种变换可以称之为哈希函数，通过哈希函数可以获取到HashCode。

哈希表的原理

哈希化后下标冲突解决
冲突不会很多

拉链法：数组的每个单元存储链表或者数组，不存储一个数据单元，比如：两个不同输入经过哈希函数计算出的下标都是0，那么以两个数据以数组或者链表的形式存储在数组下标0的数据单元中。
开放地址法：有三种方法，简单来说就是向下找空白单元，三种方法不同之处就是步长不一样。具体不说了，比较复杂，而且还有一些其他问题。以下用拉链法（java 中的hash就是拉链法）

哈希函数

快速的计算：哈希表的优势就在于效率，所以快速获取到对应的hashCode非常重要。我们需要通过快速的计算来获取到元素对应
均匀的分布：哈希表中，无论是链地址法还是开放地址发，当多个元素映射到同一个位置的时候，都会影响效率，所以优秀的哈希函数应该尽可能将元素映射到不同位置，让元素在哈希表中均匀的分布。

java中的HashMap

java中的哈希表采用的是链地址法
HashMap的初始长度为16，每次自动扩展，长度必须是2的次幂
这是为了服务于从key映射到index的算法
HashMap中为了提高效率，采用了位运算的方式，公式：index = HashCode(key) & (length - 1)，比如计算'book'的hashcode，结果为十进制的3029737，二进制为1011... 1001，假设hashmap的长度为16，length - 1的结果为十进制的15，二进制的1111，1011... 1001 & 1111 = 1001 ，等于9，所以index = 9