水煮Redisson（二三）- GEO之地球一维化

前言

上一章介绍了Redisson地图索引接口的使用方式，这里介绍一下Geo内核-GeoHash的原理。

简单来说，GeoHash将三维的地球模型抽象成一维数据，每个节点代表了一个矩形区域，方便计算附近节点集合和相应的距离。

拿一个地址举例说明【经纬度:33.762,38.465】，将经度和纬度两个数值，在下表中不断二分取值，最终会得到一串二进制编码。

得到经纬度的二进制编码之后，将奇数为纬度，偶数为经度 进行整合，五位一组，返回0-31的十进制数据。

11001 -> 十进制为25，对应Base32为T

01110 -> 十进制为14，对应Base32为F
最终得到的GeoHash码为：tf

Geohash比直接用经纬度的高效很多，而且使用者可以发布地址编码，既能表明自己位于北海公园附近，又不至于暴露自己的精确坐标，有助于隐私保护。

GeoHash编码的前缀可以表示更大的区域。例如wx4g0ec1，它的前缀wx4g0e表示包含编码wx4g0ec1在内的更大范围，这个特性可以用于附近地点搜索。编码越长，表示的范围越小，位置也越精确。因此我们就可以通过比较GeoHash匹配的位数来判断两个点之间的大概距离。

前面例子得到的GeoHash码为tf，长度为2，那么其代表的矩形区域范围为1250KM * 625KM

前面例子得到的GeoHash码为tf，长度为2，其误差大概为630KM。

GeoHash在使用过程中，会碰到一些实际问题，下面列举两个最常见的。

要计算黄点附近最近的目标，如果按区域来算的话，蓝点在同一个区域，数学上更接近，但是在图中可以直观的看出，绿点在物理上与其距离更小。

曲线突变问题比较直观，拿上面的一个图来展示

0111区块和1000在数学上更接近，只相差1，但是在物理上其实与0010距离更小。

上面两个问题，可以用同一种方案来解决，就是计算自身位置附近8个区域内，所有候选目标与自己的实际距离，最后再决定展示效果。至于如何获取这8个区域的GeoHash值，可以直接修改自身GeoHash的最后一位或者两位，因为都是相邻区域，GeoHash是有规律可循的。