技术栈
聚类
叫我:松哥
1 天前
前端
·
算法
·
机器学习
·
flask
·
bootstrap
·
echarts
·
聚类
基于机器学习的地震风险评估与可视化系统,采用Flask后端与Bootstrap前端,系统集成DBSCAN空间聚类算法与随机森林算法
地震数据分析系统是一个基于机器学习的地震风险评估与可视化平台,采用Flask后端框架与Bootstrap前端框架构建。系统集成了DBSCAN空间聚类算法与随机森林分类器,能够对地震数据进行智能分析和风险预测。平台提供用户端与管理端双端功能,支持数据导入、清洗、可视化展示、风险评估及用户权限管理。系统采用SQLite数据库存储数据,使用ECharts实现交互式数据可视化,界面设计采用深色科技风格,支持响应式布局,为地震研究与管理决策提供数据支持。
小鸡吃米…
2 天前
机器学习
·
支持向量机
·
聚类
机器学习 - BIRCH 聚类
摘要:BIRCH是一种高效的层次聚类算法,适用于大规模数据集。它通过聚类特征(CF)和子聚类特征(SCF)数据结构构建树形聚类结构,包含初始化、聚类和优化三个步骤。Python中可使用scikit-learn的Birch类实现,具有可扩展性强、内存效率高等优点,但对参数敏感且处理非球形聚类能力有限。该算法默认使用欧氏距离,在聚类速度和内存使用方面表现优异,但应用场景受限于其假设条件。
木头程序员
2 天前
大数据
·
人工智能
·
机器学习
·
回归
·
聚类
机器学习概述:核心范式、关键技术与应用展望
摘要:机器学习作为人工智能的核心分支,通过让计算机从数据中自主学习规律并优化决策,彻底改变了传统编程的问题解决模式。本文从机器学习的本质定义出发,系统梳理其核心学习范式(监督学习、无监督学习、强化学习等)的技术逻辑,深入解析关键技术体系与实践流程,结合典型应用案例说明技术落地价值,最后客观分析当前发展瓶颈与未来突破方向,为技术学习者和开发者提供全面且严谨的知识框架。
key06
4 天前
人工智能
·
分类
·
聚类
数据分类分级的一种新路径 从确定性原点出发:以风险为核心的聚类收敛模型
数据分类分级作为数据安全治理的基石,其实践始终面临一个核心矛盾:我们试图在一个高度复杂、持续演化的数据环境中,为每一份数据给出确定的风险归属。这种以全量覆盖为目标的普查式思维,往往导致投入产出比极低,治理过程长期陷入高成本、低收敛的状态。
kaikaile1995
6 天前
算法
·
matlab
·
聚类
ISODATA聚类方法在MATLAB中的实现指南
ISODATA(Iterative Self-Organizing Data Analysis Technique)是一种动态聚类算法,通过迭代调整聚类中心、合并相似类、分裂离散类,实现数据集的自适应分类。其核心步骤如下:
光羽隹衡
6 天前
机器学习
·
kmeans
·
聚类
机器学习——K-means聚类
K-means是一种基于距离的划分聚类方法,通过迭代将数据划分为K个簇。核心思想是使簇内样本的平方误差最小化。算法流程包括初始化聚类中心、分配样本到最近中心、重新计算中心位置,直到收敛。
爱打代码的小林
7 天前
算法
·
机器学习
·
聚类
机器学习(聚类算法)
聚成多少个簇:需要指定K的值 距离的度量:一般采用欧式距离距离:曼哈顿距离:欧式距离:a(i):对于第i个元素xi,计算xi与其同一个簇内所有其他元素距离的平均值,表示了簇内的凝聚程度。 b(i):选取xi外的一个簇,计算xi与该簇内所有点距离的平均距离,遍历其他所有簇,取所有平均值中最小的一个,表示簇间的分离度。 计算所有x的轮廓系数,求出平均值即为当前聚类的整体轮廓系数。
F_D_Z
8 天前
机器学习
·
kmeans
·
聚类
K-Means 聚类的目标函数:簇内误差平方和
K-Means 是一种无监督、迭代式的聚类算法: 给定数据集 {x₁, x₂, …, xₙ} 与预设簇数 K,算法把样本划分为 K 个不相交的簇 C₁, C₂, …, Cₖ,使得同一簇内样本尽可能相似,不同簇间样本尽可能远离。
我爱C编程
8 天前
matlab
·
聚类
·
最小二乘法
·
fcm聚类法
·
t-s模糊模型
·
参数辨识
基于FCM聚类法和LS最小二乘法的T-S模糊模型参数辨识matlab仿真
目录1.引言2.算法测试效果3.算法涉及理论知识概要3.1 确定T-S模糊模型结构3.2 FCM聚类辨识前件参数
生信碱移
10 天前
算法
·
机器学习
·
数据挖掘
·
数据分析
·
聚类
单细胞空转CNV分析工具:比 inferCNV 快10倍?!兼容单细胞与空转的 CNV 分析与聚类,竟然还支持肿瘤的亚克隆树构建!
生信碱移快速CNV分析fastCNV 是scRNA-seq与空间转录组(含Visium HD)的快速 CNV 推断工具,比常规工具 inferCNV 运行速度快 10 倍,平均内存占用减少 94%。不仅如此,fastCNV 通过将 spots/cells 聚合为 meta-spots/meta-cells 以增强信号,输出全基因组 CNV 热图,并进行 CNV 聚类、克隆树推断与染色体臂级别 CNV 事件注释。
Maxwell_li1
10 天前
机器学习
·
分类
·
回归
·
聚类
机器学习知识点梳理(回归模型、分类模型、聚类模型、评估方法)-思维导图
• 回归模型:线性回归、决策树、SVM(可以,效果差) • 分类模型:逻辑回归、决策树、SVM、朴素贝叶斯(只能分类) • 聚类模型:kmeans(基于原型)、DBSCAN(基于密度)、凝聚层次(基于层次) • 评估方法: ◦ 回归问题:R2(综合指标)、均方误差(损失函数) ◦ 分类问题:查准率(评估误检)、召回率(评估漏检)、F1(综合评估前两者) ◦ 聚类问题:轮廓系数
Maxwell_li1
10 天前
机器学习
·
分类
·
回归
·
学习方法
·
聚类
·
改行学it
机器学习知识点梳理(回归模型、分类模型、聚类模型、评估方法)
• 回归模型:线性回归、决策树、SVM(可以,效果差) • 分类模型:逻辑回归、决策树、SVM、朴素贝叶斯(只能分类) • 聚类模型:kmeans(基于原型)、DBSCAN(基于密度)、凝聚层次(基于层次) • 评估方法: ◦ 回归问题:R2(综合指标)、均方误差(损失函数) ◦ 分类问题:查准率(评估误检)、召回率(评估漏检)、F1(综合评估前两者) ◦ 聚类问题:轮廓系数
yuanmenghao
10 天前
算法
·
自动驾驶
·
聚类
·
ransac
·
msac
·
系统辨识‘
MSAC 算法详解以及与 RANSAC 对比示例
前文RANSAC算法——看完保证你理解中已经阐述了关于RANSAC算法的原理以及示例。 在许多含有噪声和异常点outliers的数据拟合任务中,普通最小二乘法容易被异常点拉偏。RANSAC 可以在存在外点时稳健拟合,但在 near-outliers 情况下,它可能被误收内点,导致模型偏移。
Pyeako
11 天前
python
·
机器学习
·
kmeans
·
tf-idf
·
聚类
·
dbscan
机器学习--K-means聚类&DBSCAN&TF-IDF
1)聚成多少个簇:需要知道K的值2)距离的度量:一般采用欧式距离3)质心:各向量的均值4)优化目标:a(i):对于第i个元素xi,计算xi与其同一个簇内所有其他元素距离的平均值,表示簇内的凝聚程度
天呐草莓
11 天前
人工智能
·
python
·
算法
·
机器学习
·
数据挖掘
·
数据分析
·
聚类
聚类(Clustering)算法
在机器学习的“无监督学习”(unsupervised learning)领域中,训练样本的标记信息是未知的。我们的目标是通过对无标记训练样本的学习,来揭示数据的内在性质及规律,为进一步的数据分析提供基础。而在这些任务中,研究最多、应用最广的当属聚类(Clustering)。
core512
11 天前
人工智能
·
分类
·
生成式ai
·
聚类
·
强化学习
·
无监督学习
·
有监督学习
AI 任务分类:人工智能到底能干啥?
本文将带你通过生动的例子,通过“任务分类”的视角,看懂 AI 的能力版图。如果把人工智能(AI)比作一个刚入职的全能实习生,那么根据你交给他的任务不同,我们可以把 AI 的工作主要分为四大类:
A1008612121
12 天前
人工智能
·
机器学习
·
聚类
图论基础与谱聚类算法
参考:https://blog.csdn.net/jteng/article/details/49590069
一招定胜负
13 天前
kmeans
·
tf-idf
·
聚类
KMeans、DBSCAN聚类与TF-IDF文本特征提取
在机器学习领域,聚类算法是无监督学习的核心应用,而文本特征提取则是自然语言处理的基础步骤。本文将结合实战代码,详细拆解KMeans、DBSCAN两种经典聚类算法及TF-IDF文本特征提取方法,帮你快速掌握核心原理与落地技巧。
睡醒了叭
14 天前
opencv
·
算法
·
计算机视觉
·
聚类
图像分割-传统算法-聚类算法
聚类常用的是meanshift(均值漂移)与kmeans 具体计算流程不详细写了,有很多大佬都提供了不错的学习做资料(个人的十大算法系列有kmeans,印象中有,读研的时候写的了)。这里为自己对比梳理与代码整理。
上海乐备实生物
15 天前
信息可视化
·
数据挖掘
·
聚类
·
生信
·
单细胞测序
·
乐备实
·
聚类分群
单细胞转录组数据的聚类分群:方法、挑战与进展
单细胞转录组测序(scRNA-seq)技术已彻底改变了我们研究细胞异质性的能力,其核心价值在于揭示组织或生物样本中不同类型的细胞状态、发育轨迹和功能亚群。聚类分析作为scRNA-seq数据处理流程中的关键环节,旨在将成千上万个具有相似转录谱的细胞归并为具有生物学意义的群体,是后续进行细胞类型注释、差异表达分析、轨迹推断等高级分析的基础。因此,聚类算法的准确性、稳健性和可解释性直接决定了研究结论的可靠性。