技术栈
kmeans
星川皆无恙
13 天前
大数据
·
人工智能
·
爬虫
·
算法
·
机器学习
·
自然语言处理
·
kmeans
大数据k-means聚类算法:基于k-means聚类算法+NLP微博舆情数据爬虫可视化分析推荐系统(新版)
如果你正在准备 毕业设计、课程设计、Python 项目实战、NLP 文本分析、舆情监测系统、数据分析可视化项目,这篇项目文章很适合拿来做参考。它不是单纯讲一个爬虫脚本,也不是只放几张图表,而是把 微博数据采集、文本处理、情感分析、K-means 聚类、可视化展示、推荐逻辑 串成了一套完整系统,更接近真实项目展示和答辩材料需要的结构。
deephub
14 天前
人工智能
·
机器学习
·
kmeans
·
聚类
·
rag
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
在当前的人工智能领域LLM 及其生成能力几乎独占了所有焦点。但再精密的 RAG Pipeline,能力上限也取决于那个沉默的引擎:搜索与聚类层。 聚类不只是一项经典的数据科学任务,它是组织高维向量空间的核心机制——让 LLM 能在数十亿条文档和参数的海洋中定位正确的记忆。随着数据集规模持续扩大,沿用数十年的标准算法已经撞上了墙。
MartinYeung5
15 天前
学习
·
算法
·
kmeans
[论文学习]LLM 情境学习资料的快速精确遗忘技术:基于 In-Context Learning 与量化 K-Means 的 ERASE 方法
Fast Exact Unlearning for In-Context Learning Data for LLMs (A. Muresanu et al., ICML 2025)
暖阳华笺
20 天前
c++
·
算法
·
机器学习
·
kmeans
·
聚类
【高频考点】K-Means聚类算法
2025年9月28日 Yolo检测器中的anchor聚类(通过率100%)2026年3月4日 网络流量分析(通过率100%)
apcipot_rain
25 天前
人工智能
·
神经网络
·
安全
·
支持向量机
·
kmeans
计科八股20260604——AI安全、K-means、SVM、nano
昨天金工实习,之后上课,所以未更。今天金工实习累成傻子了,板子一边长一边短导致又重新锯了1个,他妈的右手都快报废了。
m沐沐
1 个月前
人工智能
·
python
·
算法
·
机器学习
·
pycharm
·
kmeans
·
聚类
【机器学习】聚类算法-K-means聚类
对于刚接触机器学习聚类算法的小伙伴来说,K-Means(K 均值聚类) 是最经典的无监督学习算法之一。但很多新手都会遇到一个核心问题:怎么确定聚类的最优 K 值(簇的数量)? 本文用啤酒数据集作为实战案例,选择 K-Means 最优聚类数,代码全程可直接运行,有需要可自取。
迦南的迦 亚索的索
1 个月前
算法
·
机器学习
·
kmeans
机器学习_05_k-means算法
k-Means 是一种无监督学习的聚类算法,用于将数据划分为 k 个互不重叠的簇(clusters)。 其核心思想是:通过迭代优化,将样本分配到最近的簇中心(质心),并更新质心位置,直到收敛。
沪漂阿龙
2 个月前
人工智能
·
数据挖掘
·
kmeans
·
聚类
面试题:聚类方法一文讲透——K-means、层次聚类、K 值选择、初始化、距离度量、DBSCAN 全拆解
很多人一听“聚类”就开始背 K-means、肘部法、DBSCAN,但真正到了面试里,往往一开口就乱:有的人分不清聚类和分类,有的人只会说 K-means 的流程,却讲不清为什么 K 值难选;还有的人知道 DBSCAN 能找异常点,却说不明白它到底比 K-means 强在哪。其实,这一题的核心不是背名词,而是先建立一个清晰框架:聚类到底要解决什么问题、不同算法各自依赖什么假设、参数该怎么选、什么时候该换算法。
初心未改HD
2 个月前
算法
·
机器学习
·
kmeans
机器学习之K-Means聚类算法详解
K-Means是机器学习中最经典、最广泛使用的聚类算法之一,属于无监督学习范畴。其核心思想是通过迭代优化,将n个数据点划分为k个簇,使得每个簇内的数据点尽可能紧凑相似,而不同簇之间的数据点尽可能远离。本文将从聚类基础概念出发,深入讲解K-Means的算法原理、K值选择策略、初始化方法优化,并结合scikit-learn提供完整的Python实战代码。读者通过本文可以全面掌握K-Means的理论基础与工程实践技巧。
bzmK1DTbd
2 个月前
算法
·
kmeans
·
聚类
K-Means聚类算法:无监督学习实战
K-Means是一种基于距离的无监督学习算法,通过迭代将数据划分为K个簇。核心步骤包括:数学公式: 欧氏距离公式: $$d(x, y) = \sqrt{\sum_{i=1}^{n}(x_i - y_i)^2}$$ 质心更新公式(第$j$个簇的质心$c_j$): $$c_j = \frac{1}{|S_j|}\sum_{x \in S_j}x$$
wayz11
2 个月前
算法
·
机器学习
·
分类
·
kmeans
·
聚类
Day 15 编程实战:KMeans聚类与股票风格分类
聚类评估指标速查表:
wayz11
2 个月前
机器学习
·
分类
·
kmeans
·
聚类
Day 15:KMeans聚类与股票风格分类
聚类(Clustering) 是一种无监督学习方法,将数据分成若干个组(簇),使得组内相似度高,组间相似度低。
Dfreedom.
2 个月前
人工智能
·
算法
·
机器学习
·
kmeans
·
聚类
聚类算法对比分析:K-Means、DBSCAN 与层次聚类
在数据科学和机器学习领域,我们面对的数据往往缺乏先验的标签。聚类分析作为一种核心的无监督学习方法,其目标是将数据集中的样本划分为若干个“簇”,使得同一簇内的数据尽可能相似,不同簇间的数据尽可能不同。聚类有助于我们从无序数据中发现隐藏的、有意义的群组结构,是进行数据探索、客户分群、异常检测、简化复杂系统理解的关键第一步。
DeepModel
2 个月前
开发语言
·
人工智能
·
机器学习
·
kmeans
·
batch
通俗易懂讲透 Mini-Batch K-means
Mini-Batch K-means 就是标准 K-means 的高速版,专门解决大数据跑不动的问题。本文用大白话+通俗案例+核心公式+可直接运行代码,从零讲透,适合课堂笔记、实验报告。
直有两条腿
3 个月前
算法
·
机器学习
·
kmeans
【机器学习】K-Means 算法
K-Means 算法是常用的聚类算法。 其作用是在一个高维空间,将空间中的向量按照他们的分布划分为 K 类。 具体的做法是:
jllllyuz
3 个月前
mysql
·
matlab
·
kmeans
鸢尾花数据集K-means聚类分析MATLAB实现
用于对UCI鸢尾花数据集进行K-means聚类分析。加载MATLAB内置的鸢尾花数据集显示数据集基本信息和统计特性
xiaobaibai153
3 个月前
线性回归
·
kmeans
一次试样失败催生的技术革新:福尔蒂吹瓶专用ACR助剂逆向推演与流变拟合
那年夏天,一家饮料包装厂在调试新产线时遇到个棘手问题:吹瓶过程中频繁出现壁厚不均、肩部发白、甚至局部开裂——同一套模具、同一批PET切片、连温控参数都没动,就是反复试样失败。技术人员查了一周,最后把样本寄到了青岛福尔蒂新材料有限公司。对方没急着推荐成品,而是先调取了客户现场的工艺数据:模头温度梯度、拉伸比设定、预吹压力曲线……再结合自建的流变数据库做了反向拟合分析。三天后给出一个定制化的ACR助剂方案,不是简单加点抗冲改性剂,而是在特定剪切窗口内精准调控熔体弹性与松弛时间。第二次试样,良率直接跳到98.6
2501_92487873
3 个月前
逻辑回归
·
kmeans
ISO9001是起点:福尔蒂全链路质控如何实现批次灰分差±0.08%?(含FMEA节选)
最近有位做化纤母粒应用开发的朋友问了个很实在的问题:“同样标称钙粉含量15%,为什么我们厂两批料熔体流动速率波动超8%,而客户用福尔蒂的同配方母粒却能稳定在±2%以内?”这背后其实不是单点技术差异,而是整条链路上的质量控制逻辑不同。
w_a_o
3 个月前
深度优先
·
kmeans
福尔蒂母粒单价高8.6%,但废品率降带来ROI达1:4.2
最近有位做PP薄壁注塑的朋友跟我聊起一个实际困扰:他们原来用的一款抗静电母粒,单价低但批次稳定性差,每次换批号都得调机,平均废品率接近6.8%。后来试用了青岛福尔蒂新材料的一款定制化抗静电功能母粒——单价确实比之前高出8.6%,可上线后连续三周没调整参数,最终统计下来废品率降到1.2%。算一笔账:按月产300吨制品、原料成本1.2万元/吨计,单月减少报废约16.8吨,折合直接收益超20万元;而增加的母粒采购成本不到4.8万元。投入产出比稳定维持在1:4.2以上。
w_a_o
4 个月前
python
·
机器学习
·
回归
·
kmeans
·
宽度优先
传统配方+机器学习:福尔蒂新材料用15年经验构建梯度回归预测模型(Python开源预告)
在国内塑料功能母粒这个行当里,真正能把实验室数据、产线经验、客户反馈串成一条技术闭环的企业并不多。青岛福尔蒂新材料就是其中一家——不是靠堆参数讲故事,而是用十五年持续跑通“配方迭代—工艺适配—性能验证”这条长链条的真实案例。