open3d DBSCAN 聚类

DBSCAN 聚类

一、算法原理

1.密度聚类

介绍

基于密度的噪声应用空间聚类(DBSCAN):是一种无监督的ML聚类算法。无监督的意思是它不使用预先标记的目标来聚类数据点。聚类是指试图将相似的数据点分组到人工确定的组或簇中。另一方面,DBSCAN不要求我们指定集群的数量,避免了异常值,并且在任意形状和大小的集群中工作得非常好。它没有质心,聚类簇是通过将相邻的点连接在一起的过程形成的。

原理

首先,选择一个在其半径内至少有minPts的随机点。然后对核心点的邻域内的每个点进行评估,以确定它是否在epsilon距离内有minPts (minPts包括点本身)。如果该点满足minPts标准,它将成为另一个核心点,集群将扩展。如果一个点不满足minPts标准,它成为边界点。随着过程的继续,算法开始发展成为核心点"a"是"b"的邻居,而"b"又是"c"的邻居,以此类推。当集群被边界点包围时,这个聚类簇已经搜索完全,因为在距离内没有更多的点。选择一个新的随机点,并重复该过程以识别下一个簇。

2、主要函数
python 复制代码
pcd.cluster_dbscan(eps=0.02,   # 邻域距离
                       min_points=10,  # 最小点数目
                             print_progress=True)  # 进度条展示

参数

首先,让我们定义Epsilon和最小点、应用DBSCAN算法时需要的两个参数以及一些额外的参数。

  1. **Epsilon (ɛ)(eps):**社区的最大半径。如果数据点的相互距离小于或等于指定的epsilon,那么它们将是同一类的。换句话说,它是DBSCAN用来确定两个点是否相似和属于同一类的距离。更大的epsilon将产生更大的簇(包含更多的数据点),更小的epsilon将构建更小的簇。一般来说,我们喜欢较小的值是因为我们只需要很小一部分的数据点在彼此之间的距离内。但是如果太小,您会将集群分割的越来越小。
  2. **最小点(minPts)(min_points):**在一个邻域的半径内minPts数的邻域被认为是一个簇。请记住,初始点包含在minPts中。一个较低的minPts帮助算法建立更多的集群与更多的噪声或离群值。较高的minPts将确保更健壮的集群,但如果集群太大,较小的集群将被合并到较大的集群中。

如果"最小点"= 4,则在彼此距离内的任意4个或4个以上的点都被认为是一个簇。

二、代码

python 复制代码
import open3d as o3d
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':

    pcd = o3d.io.read_point_cloud('res/monkey.ply')
    # 使用 DBSCAN 算法对点云进行聚类
    labels = np.array(pcd.cluster_dbscan(eps=0.02,   # 邻域距离
                                         min_points=10,  # 最小点数目
                                         print_progress=True))  # 进度条展示

    # 获取聚类数目
    max_label = labels.max()
    print(f"point cloud has {max_label + 1} clusters")

    # 根据聚类标签给点云上色
    colors = plt.get_cmap("tab20")(labels / (max_label if max_label > 0 else 1))
    colors[labels < 0] = 0
    pcd.colors = o3d.utility.Vector3dVector(colors[:, :3])
    # 可视化
    o3d.visualization.draw_geometries([pcd])

三、结果

原点云

DBSCAN 聚类

四、相关数据

点云密度计算:open3d 计算点云密度-CSDN博客

百度网盘数据集:

包括 obj,pcd,las,png,ply等

百度网盘链接:https://pan.baidu.com/s/1JFxKUk_xMcEmpfBHtuC-Pg

提取码:cpev

相关推荐
Blockbuater_drug12 分钟前
InChIKey: 分子的“化学身份证”,从哈希原理到全球监管合规(2025)
算法·哈希算法·inchikey·rdkit·分子表达·化学信息学
Blossom.11814 分钟前
多模态大模型LoRA微调实战:从零构建企业级图文检索系统
人工智能·python·深度学习·学习·react.js·django·transformer
小钻风336622 分钟前
软件测试: 从入门到实践 (接口测试)
软件测试·python
橙汁味的风37 分钟前
2EM算法详解
人工智能·算法·机器学习
小鸡吃米…42 分钟前
带Python的人工智能——计算机视觉
人工智能·python·计算机视觉
维构lbs智能定位44 分钟前
北斗卫星导航定位从核心框架到定位流程详解(一)
算法·北斗卫星导航定位系统
byzh_rc1 小时前
[算法设计与分析-从入门到入土] 动态规划
算法·动态规划
Halo_tjn1 小时前
Java List集合知识点
java·开发语言·windows·算法·list
玄同7651 小时前
Python 数据类型:LLM 语料与 API 参数的底层处理逻辑
开发语言·人工智能·python·自然语言处理·llm·nlp·知识图谱
databook1 小时前
数据分析师的“水晶球”:时间序列分析
python·数据挖掘·数据分析