数据分析--客户价值分析RFM(K-means聚类/轮廓系数)

原数据

复制代码
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import metrics

### 数据抽取,读⼊数据
df = pd.read_csv("customers1997.csv") #相对路径读取数据
print(df.info())
print(df.columns)
print(df.describe())
# 特征选择,选择RFM
df = df.drop(labels=['customer_id','country','education','gender','member_card','total_children'],axis=1)

一、 K-means聚类

1. K-means聚类

复制代码
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
kmeans = KMeans(n_clusters=4)   #构造聚类模型,划分为 4 类
kmeans.fit(df)  # 聚类
pre_y = kmeans.predict(df)  # 预测点在哪个聚类中,或者是直接采用 kmeans.labels_ 提取
print(pre_y)  # 输出每个样本的聚类标签

from sklearn import metrics
print("轮廓系数:",metrics.silhouette_score(df, pre_y,metric='euclidean'))
# print("轮廓系数:",metrics.silhouette_score(df, kmeans.labels_,metric='euclidean'))

2. 轮廓系数

轮廓系数取值范围[-1,1]

  • -1的效果最差
  • 1 的效果最好

二、分箱法分类

1. 分类

数据分析--客户价值分析RFM(分箱法/标准化)-CSDN博客

2.轮廓系数

复制代码
from sklearn import metrics
df_rfm = df[['Recency','Frequency', 'Monetary']]
print("轮廓系数:",metrics.silhouette_score(df_rfm, df['Segment'],metric='euclidean'))

Python------Kmeans聚类算法、轮廓系数(算法理论、代码)_python kmeans-CSDN博客

相关推荐
放下华子我只抽RuiKe52 小时前
深度学习全景指南:硬核实战版
人工智能·深度学习·神经网络·算法·机器学习·自然语言处理·数据挖掘
L***一5 小时前
2026年高职统计与大数据分析专业:直面压力,规划未来
数据挖掘·数据分析
databook7 小时前
数据团队该醒醒了:AI智能体不是你的下一个仪表盘
人工智能·数据分析·agent
wang_yb7 小时前
数据团队该醒醒了:AI智能体不是你的下一个仪表盘
ai·数据分析·databook
枫叶林FYL8 小时前
公开数据集类型汇总分类
人工智能·分类·数据挖掘
Yyyyy123jsjs10 小时前
量化交易的数据分析与策略思考
数据挖掘·数据分析
tobias.b10 小时前
什么是数据挖掘?
人工智能·数据挖掘
AI科技星11 小时前
基于空间光速螺旋第一性原理的电荷本源定义与电场时空协变方程的完整推导、严格证明及全尺度数值验证
c语言·开发语言·算法·机器学习·数据挖掘
Datacarts11 小时前
洞察电商数据:淘宝商品详情 API 数据模型
信息可视化·数据挖掘·数据分析
数据科学小丫11 小时前
finebi 案例3 健身房数据分析(建模)
大数据·数据分析·finebi