R-Tree可以称作空间索引的基石,目前流行的时空索引架构都是基于R-Tree衍生而来。
R-Tree的概念
R-Tree 主要用于索引多维信息(如地理点坐标、矩形或多边形)的一种数据结构。R -Tree是由Guttman在1984年提出的,在理论和应用上都有重要的应用。 R-Tree在现实世界中的一个常见用法是存储空间对象,如餐馆位置或典型地图所用的多边形: 街道、建筑物、湖泊轮廓、海岸线等,然后快速找到问题的答案,如"在我当前位置2公里内找到所有博物馆"、"检索我所在位置2公里内的所有道路段"(将它们显示在导航系统中)或"找到最近的加油站"(尽管没有考虑道路)。R-Tree 还可以加速最近邻搜索各种距离度量,包括大圆距离。
R-Tree其用一个边平行于坐标轴的最小的矩形(MBR,Minimum Bounding Box)框住空间对象。在查询时,只需要先找到空间对象的MBR即可,如下图所示:
与B-Tree类似,R-Tree是一个平衡的多路查找树,在树的节点上利用到了MBR的信息进行查找。
下图显示RTree的树形结构,其中MBR即是(x1,y1,x2,y2),数据都保存在叶子节点(Entry)。
mbr=Rectangle [x1=14.0, y1=14.0, x2=86.0, y2=91.0]
mbr=Rectangle [x1=36.0, y1=60.0, x2=59.0, y2=91.0]
entry=Entry [value=1, geometry=Point [x=59.0, y=91.0]]
entry=Entry [value=3, geometry=Point [x=36.0, y=60.0]]
mbr=Rectangle [x1=14.0, y1=14.0, x2=86.0, y2=37.0]
entry=Entry [value=5, geometry=Point [x=14.0, y=37.0]]
entry=Entry [value=4, geometry=Point [x=57.0, y=36.0]]
entry=Entry [value=2, geometry=Point [x=86.0, y=14.0]]
R-Tree的变种
R-Tree的变种有很多,
- R*Tree:R*树通过结合修改后的节点拆分算法和在节点溢出时强制重新插入的概念,去尝试减少覆盖和重叠,提高查询效率。
- R+Tree:R+树是R树和k-d树这两种空间检索方式的折中办法。
基于不同的批量加载算法,有STR(Sort-Tile-Recursive)RTree、Nearest-X RTree、Packed Hilbert RTree(Space-filling Curve)等常见。