大数据集群离线解析经纬度逆编码地址

圆内~搁浅2024-06-23 19:23

最近有个需要需求把经纬度解析为地址，那么通常解析地址市面上流行的方案就是调取百度、高德地图的接口进行解析。

但是在用这个方案遇到一个问题就是企业认证的百度地图每天的逆编码解析为300w次，qps为100次/秒，对于日增上千万的数据量需求来说，这个是远远不够的，并且需要sparkstreaming实时流处理数据，qps为2000次/秒，这么高的并发，调取接口查看远远是不够的。

采用离线解析的形式进行解析地址，这个方案是理由每个城市的边界经纬度进行判断处理，调取高德地图的边界信息，到区的数据数据量大概是3000左右，预计每天更新一次就行。

两种方案各有利弊，追求准确度的话肯定是调用接口更好，其他方面的话离线解析更有优势。