前言
POI数据处理,原始数据为csv格式,整理入库至PostGreSQL,本例使用PostGreSQL13版本。
一、POI
POI(一般作为Point of Interest的缩写,也有Point of Information的说法),通常称作兴趣点,泛指互联网电子地图中的点类数据,基本包含名称、地址、坐标、类别四个属性;源于基础测绘成果DLG(Digital Line Graphic,数字线划地图)产品中点类地图要素矢量数据集;在GIS(Geographic Information System,地理信息系统)中指可以抽象成点进行管理、分析和计算的对象。
二、数据介绍
样例数据
现有全国POI数据8000多万条数据,如下图
分类提取
现要提取一二级分类目录,SQL语句如下:
sql
select type1 ,type2 from china_poi.china_poi_v2 group by type1,type2 order by type1,type2 ;
查询结果如下所示:
优化SQL语句
查询全表数据,效率很低,增加WHERE pcode = 110000(北京市),以便提高效率
sql
-- 查询全表数据,效率很低,增加WHERE pcode = 110000(北京市),以便提高效率
select type1 ,type2 from china_poi.china_poi_v2 WHERE pcode = 110000 group by type1,type2 order by type1,type2 ;
提取结果至另一张表
将以上查询结果保存至china_poi.tb_ClassInfo表中,对应SQL语句如下:
sql
SELECT * into china_poi.tb_ClassInfo FROM (select type1 ,type2 from china_poi.china_poi_v2 WHERE pcode = 110000 group by type1,type2 order by type1,type2 ) as t1;
结果
china_poi.tb_ClassInfo表中数据如下