金融机器学习方法:K-均值算法

目录

1.算法介绍

2.算法原理

3.python实现示例


1.算法介绍

K均值聚类算法是机器学习和数据分析中常用的无监督学习方法之一,主要用于数据的分类。它的目标是将数据划分为几个独特的、互不重叠的子集或"集群",以使得同一集群内的数据点彼此相似,而不同集群的数据点则尽可能不同。

2.算法原理

  1. 选择K个初始质心,这些质心可以是随机选取的数据点或其他方法得到的。
  2. 根据每个数据点到质心的距离,将其分配给最近的质心,形成K个集群。
  3. 重新计算每个集群的质心。
  4. 重复上述步骤,直到质心不再发生变化或达到一定的迭代次数

3.python实现示例

python 复制代码
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 随机生成数据
np.random.seed(0)
points = np.vstack([
    np.random.normal(0, 0.5, size=(100, 2)),
    np.random.normal(1, 0.25, size=(100, 2)),
    np.random.normal(2, 0.6, size=(100, 2))
])

# 使用KMeans进行聚类
kmeans = KMeans(n_clusters=3)
kmeans.fit(points)
labels = kmeans.predict(points)
centroids = kmeans.cluster_centers_

# 可视化结果
plt.scatter(points[:, 0], points[:, 1], c=labels)
plt.scatter(centroids[:, 0], centroids[:, 1], color='red', marker='X')
plt.show()

结果图:


相关推荐
databook1 小时前
Manim实现闪光轨迹特效
后端·python·动效
Juchecar3 小时前
解惑:NumPy 中 ndarray.ndim 到底是什么?
python
用户8356290780513 小时前
Python 删除 Excel 工作表中的空白行列
后端·python
Json_3 小时前
使用python-fastApi框架开发一个学校宿舍管理系统-前后端分离项目
后端·python·fastapi
数据智能老司机10 小时前
精通 Python 设计模式——分布式系统模式
python·设计模式·架构
数据智能老司机11 小时前
精通 Python 设计模式——并发与异步模式
python·设计模式·编程语言
数据智能老司机11 小时前
精通 Python 设计模式——测试模式
python·设计模式·架构
数据智能老司机11 小时前
精通 Python 设计模式——性能模式
python·设计模式·架构
c8i11 小时前
drf初步梳理
python·django
每日AI新事件11 小时前
python的异步函数
python