【PostGIS】POSTGIS实现聚类统计提取外轮廓

项目需求根据某些条件进行聚类统计,然后返回聚类的外轮廓,这里主要用到POSTGIS的两个算法,一个是聚类统计功能,一个是提取外轮廓的功能。

1. 聚类统计

Postgis主要实现并提供了四种聚类方法,前两个为窗口函数,后两个为聚合函数:

ST_ClusterKMeans -- 该函数是窗口函数,主要是用K-means(K均值聚类)算法进行聚类,算法原理比较简单,容易实现,主要适用于点样本数据,如果是多边形则用多边形的中心点计算,只有一个参数K簇,就是事先明确了要把这一堆样本数据聚成K个类,然后去计算一个目标函数达到最优解,因此K值对结果影响比较大,不太好选取,而且该算法而且适合凸的数据集,这也算法容易收敛;

ST_ClusterDBSCAN -- 该函数也是窗口函数,主要利用DBSCAN算法对输入的地理要空间素进行聚类,该算法基于密度进行聚类,直觉上更加符合认知,主要是通过地理要素分布的紧密程度决定,同一类别的样本之间是紧密相连的,不同样本是分离的。该算法相对复杂,比较常用,聚类效果较好,。

ST_ClusterIntersecting -- 该函数是一个聚合函数,方法比较好理解,顾名思义就是把相交关联关系的地理要素作为一个类簇。具体的函数声明和用法,看官网的例子介绍很容易看懂,也可以拿数据进行测试实验,不是很常用,不做重点;

ST_ClusterWithin -- 该函数也是一个聚合函数,也很好理解,顾名思义通过一个距离参数,将距离之内的地理要素聚成一个类别,距离之外的就是非同类。详细可参考官网,也不做重点;

综合自己的需求,采用ST_ClusterDBSCAN函数

函数定义,有三个参数,(窗口函数中的每一个地理要素,搜索半径,最小点数),根据以上分析应该不难理解:

integer ST_ClusterDBSCAN(geometry winset geom, float8 eps, integer minpoints);

例:

sql 复制代码
SELECT ST_ClusterDBSCAN(geom, eps := 0.000179, minpoints := 2) OVER () AS cluster_id,* FROM 表名

这里的eps需要根据表的srid来调整,我这边表的srid2为4490,是经纬度坐标,所以这里的0.000179也是经纬度的距离,大约20米,返回的cluster_id就是聚类后的类id,可以通过它将同一聚类的记录取出来。

2.外轮廓计算

  1. 计算凸包
    计算凸包十分简单,使用ST_ConvexHull即可,但同时可能失去很多特征点,生成的任务区比较粗,只能是一个大致的范围。
sql 复制代码
select ST_ConvexHull ((select ST_Collect(shape) from 表名))
  1. 计算凹包
    计算凹包十分简单相对复杂一些,使用ST_ConcaveHull,但相对于凸包会多保留一些特征点,生成的任务区保留了一些弯曲变化。

这个函数有三个参数:

  • geometry geom ,几何体
  • float target_percent,特征点抛弃的比例,0.1-0.99,越小特征保留的越多,但计算效率越低。当等于1时,和凸包的计算效果是一样的。
  • boolean allow_holes ,是否允许有洞
sql 复制代码
select ST_ConcaveHull ((select ST_Collect(shape) from 表名),0.7)

根据需求,我们选择凹包的计算方式

3.实现需求

这里聚类和计算外轮廓分步进行计算

  1. 首先进行聚类查询
sql 复制代码
SELECT ST_ClusterDBSCAN(geom, eps := 0.000179, minpoints := 2) OVER () AS cluster_id,* FROM allrecord

这里allrecord我是用了with子句的查询结果,目的是实现按照项目需求条件进行查询,这里不再展示

  1. 在java程序中完成聚类统计
java 复制代码
Map<Integer, List<实体类>> collect = 聚类查询结果list.stream().filter(tcql -> tcql.getCluster_id() != null).collect(Collectors.groupingBy(实体类::getCluster_id));

然后分别将上述map中的id分别取出来,后续计算外轮廓是用

  1. 计算外轮廓
    这里直接将mapper的配置写出来
xml 复制代码
 <select id="selectConcaveHull" resultType="java.util.Map">
        with concaveResult as(
        select ST_ConcaveHull ((select ST_Collect(geom) from 表名 where id in
        <foreach collection="idList" item="id" separator="," open="(" close=")">
            #{id}
        </foreach>
        ),0.7) geom
        )
        select st_astext(geom) geomtext,st_area(st_transform(geom,4528)) geomarea from concaveResult

    </select>

由于这里还计算了面积,所以还是采用了with子句的方式,现将凹包的geom查询出来,然后再取text形式和面积

参考文章
Postgis实现聚类分析
基于PostGIS实现大量不相邻多边形的外轮廓提取

相关推荐
秉承初心6 天前
PostgreSQL 数据性能瓶颈突破实战
数据库·postgresql·oracle
有Li6 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
IvorySQL6 天前
PostgreSQL 技术日报 (6月15日)|PG19 性能优化推进,POSETTE 大会倒计时 2 天
数据库·人工智能·postgresql·开源
IvorySQL6 天前
PostgreSQL 技术日报 (6月16日)|Neon 自动化再进一步,逻辑复制冲突日志迎来 v50 更新
数据库·postgresql·自动化
倒流时光三十年6 天前
PostgreSQL 聊一下索引和排序规则
postgresql
睡不醒男孩0308237 天前
PostgreSQL 数据库运维转型:从传统模式到 CLup 平台的 25 个核心 FAQ
运维·数据库·postgresql
deephub7 天前
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
人工智能·机器学习·kmeans·聚类·rag
JOJO数据科学7 天前
pgAdmin4 Electron 鸿蒙 PC 适配全记录:从白屏到连接 PostgreSQL
postgresql·electron·harmonyos
日取其半万世不竭7 天前
PostgreSQL 跑在 Docker 里怎么备份?恢复成功才算备份成功
数据库·docker·postgresql
倒流时光三十年7 天前
PostgreSQL LEAST 表达式函数详解
数据库·postgresql