聚类

有Li13 天前
论文阅读·学习·数据挖掘·聚类·文献·医学生
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展2026.6.16本文提出 PTCMIL,在 ViT 中用可学习提示 token 进行端到端、任务感知的切片内聚类与原型聚合,提升 WSI 分类、生存预测和跨域适应性能。
deephub14 天前
人工智能·机器学习·kmeans·聚类·rag
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类在当前的人工智能领域LLM 及其生成能力几乎独占了所有焦点。但再精密的 RAG Pipeline,能力上限也取决于那个沉默的引擎:搜索与聚类层。 聚类不只是一项经典的数据科学任务,它是组织高维向量空间的核心机制——让 LLM 能在数十亿条文档和参数的海洋中定位正确的记忆。随着数据集规模持续扩大,沿用数十年的标准算法已经撞上了墙。
叫我:松哥16 天前
人工智能·python·神经网络·算法·机器学习·flask·聚类
基于机器学习和flask的体育健身风险智能分析系统,系统集成DeepSeek、聚类算法、分类算法等,准确率达90%1 绪 论1.1 研究背景与意义近年来,随着生活水平的提高和健康意识的增强,参与健身运动的人数持续增长。健身房、健身工作室等场所成为人们日常锻炼的重要选择。然而,不科学的运动方式、过度的训练强度以及忽视个体差异等因素,可能导致运动损伤、心血管事件等健康风险。根据相关研究,约有30%的健身爱好者曾经历过不同程度的运动损伤,而患有潜在疾病的人群在高强度运动中发生意外的风险更高。因此,对健身过程中的健康风险进行评估和预警具有重要的现实意义。
暖阳华笺20 天前
c++·算法·机器学习·kmeans·聚类
【高频考点】K-Means聚类算法2025年9月28日 Yolo检测器中的anchor聚类(通过率100%)2026年3月4日 网络流量分析(通过率100%)
zhumin72621 天前
机器学习·数据挖掘·聚类
基于人类行为聚类与虚拟内分泌时间序列的硅基情绪计算模型构建研究当前人工智能(AI)的情感计算多依赖于静态Prompt或外挂规则,缺乏人类情绪的连续性、滞后性与环境累积效应。本文提出一种全新的硅基内分泌情绪计算框架——时间序列激素叠加模型(Temporal Hormonal Superposition Model, THSM)。该模型通过对多模态人类行为大数据进行无监督聚类,提取“情景-激素响应”的归一化相对量映射矩阵;在AI内部构建基于指数衰减的虚拟激素池,并引入初始基因种子(Seed)与长期环境累积因子(E)的交互作用。最终,模型通过非线性状态机调制大语言模型(L
Dontla22 天前
算法·数据挖掘·聚类
聚类找不到簇原因分析(聚类失败)(DBSCAN聚类算法、eps参数、Epsilon参数、最大允许距离)红框这一行其实是在说 DBSCAN 聚类算法的参数调得不合适,导致聚类失败或者聚类效果很差。先拆开看:
幽冥三王爷24 天前
智能手机·数据挖掘·聚类·蓝牙定位·rssi
手机蓝牙分档策略的理论基础与科学定档方法:从 RSSI 物理规律到稳健聚类定档在蓝牙定位、靠近解锁、迎宾感应、无钥匙进入、座舱联动等汽车电子场景里,系统经常使用手机上报的 RSSI(Received Signal Strength Indicator,接收信号强度指示)作为距离判断依据。
机器学习之心1 个月前
matlab·数据挖掘·聚类
基于投影寻踪动态聚类的多指标综合评价方法(PPDC),实验文档+MATLAB代码在当今数据驱动的时代,无论是企业绩效评估、区域经济发展评价,还是学术成果排名,都面临着如何从海量、多维度的指标数据中挖掘有效信息、做出科学分类的难题。传统的聚类方法往往在处理高维数据时面临**“维度诅咒”**的困扰,而简单的降维手段又可能丢失关键的评价信息。
哈伦20191 个月前
数据挖掘·汽车·聚类
第十章 聚类 案例:汽车款式聚类本案例的数据基于R语言 ISLR 包中的Auto数据集,数据集中共有392个样本, 8个特征,根据每种汽车的参数,利用聚类算法来进行聚类,识别出相似的汽车。
yingjie1101 个月前
机器学习·数据挖掘·聚类
Scanpy 单细胞转录组分析完整流程(上):从原始数据到细胞聚类单细胞转录组测序(scRNA-seq)是当前生物医学研究中最热门的技术之一。从肿瘤微环境解析到发育轨迹追踪,scRNA-seq 已经成为高水平论文的标配。本文用 Scanpy(Python) 带你走完单细胞分析的前半程——从数据读取到降维聚类。
Bingorl1 个月前
算法·机器学习·聚类
机器学习之聚类算法聚类算法是一种无监督学习算法,主要是根据样本之间的相似度将样本划分到不同分类中来进行结果预测的。样本的相似性可以通过样本点之间的距离来衡量。常见的相似度计算方法有:
m沐沐1 个月前
人工智能·python·算法·机器学习·pycharm·kmeans·聚类
【机器学习】聚类算法-K-means聚类对于刚接触机器学习聚类算法的小伙伴来说,K-Means(K 均值聚类) 是最经典的无监督学习算法之一。但很多新手都会遇到一个核心问题:怎么确定聚类的最优 K 值(簇的数量)? 本文用啤酒数据集作为实战案例,选择 K-Means 最优聚类数,代码全程可直接运行,有需要可自取。
qingyulee1 个月前
算法·聚类·集成学习
集成学习、聚类算法通过多个模型的组合形成一个精度更高的模型,参与组合的模型称为弱学习器(弱学习器)。训练时,使用训练集依次训练出这些弱学习器,对未知的样本进行预测时,使用这些弱学习器联合进行预测。
Dontla1 个月前
机器学习·支持向量机·聚类
IVFFlat索引上下文中聚类介绍(将相似向量分到同一组,称为“簇”,使得组内向量彼此相似(例如用余弦相似度衡量),组间向量差异较大)ANN近似最近邻聚类是将相似的向量分到同一组(称为“簇”),使得:在 IVFFlat 中,聚类通常通过 k-means 算法 实现(例如将全部向量分成 lists = 100 个簇)。
三维重建-光栅投影1 个月前
机器学习·数据挖掘·聚类
PCL之欧式聚类在 PCL 中,欧式聚类通常指:它的作用是:根据点与点之间的空间距离,把点云划分成若干个独立的点集。简单来说,如果一堆点在空间上靠得比较近,就认为它们属于同一个物体;如果两堆点之间距离比较远,就认为它们属于不同物体。
njsgcs1 个月前
开发语言·python·聚类
我仓库内cad python 有哪些应用到聚类的方法根据仓库里的代码,CAD Python 没有使用 sklearn 等通用聚类库(如 KMeans、DBSCAN),而是采用一套基于几何距离的自定义线段聚类,再叠加包围盒与下游业务处理。
Hua-Jay1 个月前
c++·笔记·opencv·学习·计算机视觉·聚类
OpenCV联合C++/Qt 学习笔记(二十五)----监督学习聚类及K均值聚类对于一个未知样本,统计距离它最近的 K 个已知样本,根据这些邻居的类别来决定当前样本属于哪一类。寻找一个“最优超平面”,将不同类别的样本最大间隔地分开。
helx821 个月前
运维·自动化·聚类
Gemini镜像站驱动的运维事件自动复盘:从日志聚类到根因定位的全链路自动化对于运维和SRE团队,每次线上故障后的复盘文档和行动项追踪,是最容易被拖延的高价值工作。通过大模型将散乱的日志、告警和聊天记录转化为结构化的根因分析报告,可以大幅缩短从“发生故障”到“完成复盘”的闭环时间。目前国内技术团队可以直接使用RskAi(ai.jingxiang.me),它聚合了Gemini、GPT、Claude、Grok等模型,国内网络直接访问,无需额外环境配置。本文将演示如何编排一条从原始日志到可提交复盘报告的全自动管道,所有Prompt和测试数据均可复现。
Yvonne爱编码1 个月前
算法·机器学习·聚类
机器学习---聚类四大算法完整实验教程(层次 / K-Means/GMM/ 谱聚类)新晋码农一枚,小编会定期整理一些写的比较好的代码和知识点,作为自己的学习笔记,试着做一下批注和补充,转载或者参考他人文献会标明出处,非商用,如有侵权会删改!欢迎大家斧正和讨论!本章内容较多,可点击文章目录进行跳转!
龙侠九重天1 个月前
人工智能·深度学习·数据挖掘·大模型·llm·embedding·聚类
Embedding 模型深度使用——语义搜索与聚类Embedding(嵌入)是一种将离散、高维的符号数据映射到连续、低维向量空间的技术。在自然语言处理领域,Embedding 将文字、句子或文档转换为数值向量,使得语义相近的内容在向量空间中拥有相似的位置关系。