kmeans

迦南的迦 亚索的索1 天前
算法·机器学习·kmeans
机器学习_05_k-means算法k-Means 是一种无监督学习的聚类算法,用于将数据划分为 k 个互不重叠的簇(clusters)。 其核心思想是:通过迭代优化,将样本分配到最近的簇中心(质心),并更新质心位置,直到收敛。
沪漂阿龙6 天前
人工智能·数据挖掘·kmeans·聚类
面试题:聚类方法一文讲透——K-means、层次聚类、K 值选择、初始化、距离度量、DBSCAN 全拆解很多人一听“聚类”就开始背 K-means、肘部法、DBSCAN,但真正到了面试里,往往一开口就乱:有的人分不清聚类和分类,有的人只会说 K-means 的流程,却讲不清为什么 K 值难选;还有的人知道 DBSCAN 能找异常点,却说不明白它到底比 K-means 强在哪。其实,这一题的核心不是背名词,而是先建立一个清晰框架:聚类到底要解决什么问题、不同算法各自依赖什么假设、参数该怎么选、什么时候该换算法。
初心未改HD7 天前
算法·机器学习·kmeans
机器学习之K-Means聚类算法详解K-Means是机器学习中最经典、最广泛使用的聚类算法之一,属于无监督学习范畴。其核心思想是通过迭代优化,将n个数据点划分为k个簇,使得每个簇内的数据点尽可能紧凑相似,而不同簇之间的数据点尽可能远离。本文将从聚类基础概念出发,深入讲解K-Means的算法原理、K值选择策略、初始化方法优化,并结合scikit-learn提供完整的Python实战代码。读者通过本文可以全面掌握K-Means的理论基础与工程实践技巧。
bzmK1DTbd7 天前
算法·kmeans·聚类
K-Means聚类算法:无监督学习实战K-Means是一种基于距离的无监督学习算法,通过迭代将数据划分为K个簇。核心步骤包括:数学公式: 欧氏距离公式: $$d(x, y) = \sqrt{\sum_{i=1}^{n}(x_i - y_i)^2}$$ 质心更新公式(第$j$个簇的质心$c_j$): $$c_j = \frac{1}{|S_j|}\sum_{x \in S_j}x$$
wayz1122 天前
算法·机器学习·分类·kmeans·聚类
Day 15 编程实战:KMeans聚类与股票风格分类聚类评估指标速查表:
wayz1123 天前
机器学习·分类·kmeans·聚类
Day 15:KMeans聚类与股票风格分类聚类(Clustering) 是一种无监督学习方法,将数据分成若干个组(簇),使得组内相似度高,组间相似度低。
Dfreedom.1 个月前
人工智能·算法·机器学习·kmeans·聚类
聚类算法对比分析:K-Means、DBSCAN 与层次聚类在数据科学和机器学习领域,我们面对的数据往往缺乏先验的标签。聚类分析作为一种核心的无监督学习方法,其目标是将数据集中的样本划分为若干个“簇”,使得同一簇内的数据尽可能相似,不同簇间的数据尽可能不同。聚类有助于我们从无序数据中发现隐藏的、有意义的群组结构,是进行数据探索、客户分群、异常检测、简化复杂系统理解的关键第一步。
DeepModel1 个月前
开发语言·人工智能·机器学习·kmeans·batch
通俗易懂讲透 Mini-Batch K-meansMini-Batch K-means 就是标准 K-means 的高速版,专门解决大数据跑不动的问题。本文用大白话+通俗案例+核心公式+可直接运行代码,从零讲透,适合课堂笔记、实验报告。
直有两条腿2 个月前
算法·机器学习·kmeans
【机器学习】K-Means 算法K-Means 算法是常用的聚类算法。 其作用是在一个高维空间,将空间中的向量按照他们的分布划分为 K 类。 具体的做法是:
jllllyuz2 个月前
mysql·matlab·kmeans
鸢尾花数据集K-means聚类分析MATLAB实现用于对UCI鸢尾花数据集进行K-means聚类分析。加载MATLAB内置的鸢尾花数据集显示数据集基本信息和统计特性
xiaobaibai1532 个月前
线性回归·kmeans
一次试样失败催生的技术革新:福尔蒂吹瓶专用ACR助剂逆向推演与流变拟合那年夏天,一家饮料包装厂在调试新产线时遇到个棘手问题:吹瓶过程中频繁出现壁厚不均、肩部发白、甚至局部开裂——同一套模具、同一批PET切片、连温控参数都没动,就是反复试样失败。技术人员查了一周,最后把样本寄到了青岛福尔蒂新材料有限公司。对方没急着推荐成品,而是先调取了客户现场的工艺数据:模头温度梯度、拉伸比设定、预吹压力曲线……再结合自建的流变数据库做了反向拟合分析。三天后给出一个定制化的ACR助剂方案,不是简单加点抗冲改性剂,而是在特定剪切窗口内精准调控熔体弹性与松弛时间。第二次试样,良率直接跳到98.6
2501_924878732 个月前
逻辑回归·kmeans
ISO9001是起点:福尔蒂全链路质控如何实现批次灰分差±0.08%?(含FMEA节选)最近有位做化纤母粒应用开发的朋友问了个很实在的问题:“同样标称钙粉含量15%,为什么我们厂两批料熔体流动速率波动超8%,而客户用福尔蒂的同配方母粒却能稳定在±2%以内?”这背后其实不是单点技术差异,而是整条链路上的质量控制逻辑不同。
w_a_o2 个月前
深度优先·kmeans
福尔蒂母粒单价高8.6%,但废品率降带来ROI达1:4.2最近有位做PP薄壁注塑的朋友跟我聊起一个实际困扰:他们原来用的一款抗静电母粒,单价低但批次稳定性差,每次换批号都得调机,平均废品率接近6.8%。后来试用了青岛福尔蒂新材料的一款定制化抗静电功能母粒——单价确实比之前高出8.6%,可上线后连续三周没调整参数,最终统计下来废品率降到1.2%。算一笔账:按月产300吨制品、原料成本1.2万元/吨计,单月减少报废约16.8吨,折合直接收益超20万元;而增加的母粒采购成本不到4.8万元。投入产出比稳定维持在1:4.2以上。
w_a_o2 个月前
python·机器学习·回归·kmeans·宽度优先
传统配方+机器学习:福尔蒂新材料用15年经验构建梯度回归预测模型(Python开源预告)在国内塑料功能母粒这个行当里,真正能把实验室数据、产线经验、客户反馈串成一条技术闭环的企业并不多。青岛福尔蒂新材料就是其中一家——不是靠堆参数讲故事,而是用十五年持续跑通“配方迭代—工艺适配—性能验证”这条长链条的真实案例。
Σίσυφος19002 个月前
算法·kmeans·聚类
PCL聚类 之K-Means目标:把点云分成 KKK 个簇,使簇内点尽量接近簇中心,簇间尽量远。假设点云:
觅特科技-互站3 个月前
运维·prompt·线性回归·kmeans·devops
告别手动微调Prompt:DevOps用陌讯Skills重构AI运维工作流凌晨两点,张磊还在改一段CI/CD流水线里的YAML配置。不是不会写,而是每次都要反复调整prompt——“请根据Spring Boot 3.2生成带健康检查的Dockerfile”、“再加一个Prometheus指标暴露端口”,试了三次,模型要么漏掉livenessProbe,要么把镜像tag写成latest。他合上笔记本,叹了口气:这哪是AI帮忙,分明是AI在等人教它做事。
癫狂的兔子3 个月前
算法·机器学习·kmeans
【Python】【机器学习】K-MEANS算法欧式距离 曼哈顿距离 余弦相似度 A与B表示向量(x1,y1),(x2,y2) 分子为A与B的点乘,分母为二者各自的L2相乘,即将所有维度值的平方相加后开方。 新质心的计算 分别计算到簇内其他点距离均值最小的点作为质心(对于拥有坐标的簇可以计算每个簇坐标的均值作为质心) 比如一个新簇有3个样本:[[1,4], [2,5], [3,6]],得到此簇的新质心=[(1+2+3)/3, (4+5+6)/3]
uesowys3 个月前
算法·spark·kmeans
Apache Spark算法开发指导-K-meansK-means 是一种广泛使用的无监督学习聚类算法,其核心目标是将数据集划分为 K 个簇,使得每个簇内的数据点尽可能相似,而不同簇之间的差异尽可能大。该算法通过迭代优化簇的中心(质心),最小化数据点与其所属簇质心之间的距离平方和,从而实现紧凑且分离度高的聚类效果。
Testopia3 个月前
人工智能·机器学习·kmeans·ai编程·聚类
健康行为监测与久坐提醒:K-Means聚类在健康领域的应用现代人久坐不动是健康的一大隐患。世界卫生组织(WHO)指出,久坐是导致多种慢性疾病的重要因素,包括心血管疾病、糖尿病、肥胖等。随着智能手机和可穿戴设备的普及,我们可以通过传感器数据监测用户的行为模式,识别静止和运动状态,并根据静止时间提供个性化的健康建议。
foundbug9993 个月前
matlab·kmeans·聚类
基于MATLAB的FCM与K-means图像聚类分割实现特征增强:结合颜色(HSV)与空间坐标(x,y)提升分割连续性:初始化优化:使用K-means++提升聚类质量: