【BXZ_231228】使用Sklearn Kmeans及RFM对淘宝客户进行分类关怀

复制代码
import random
import string
from datetime import datetime

def generate_random_string(length=3):
    characters = string.ascii_uppercase
    return ''.join(random.choice(characters) for _ in range(length))

def generate_timestamped_string(separator='_'):
    timestamp = datetime.now().strftime('%y%m%d') # %H%M%S
    random_part = generate_random_string(length=3)
    return random_part+separator+timestamp

timestamped_string = generate_timestamped_string()
print('【{0}】'.format(timestamped_string))

【Talk is cheap】

复制代码
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文
plt.rcParams['axes.unicode_minus'] = False # 显示负号
warnings.filterwarnings("ignore")
%matplotlib inline

...
Index(['买家会员名', '买家实际支付积分', '买家实际支付金额', '买家应付货款', '买家应付邮费', '买家支付宝账号',
       '买家支付积分', '买家服务费', '买家留言', '修改后的sku', '修改后的收货地址', '分阶段订单信息', '卖家服务费',
       '发票抬头', '含应开票给个人的个人红包', '天猫卡券抵扣', '定金排名', '宝贝总数量', '宝贝标题 ', '宝贝种类 ',
       '店铺Id', '店铺名称', '异常信息', '总金额', '打款商家金额', '支付单号', '支付详情', '收货人姓名',
       '收货地址', '新零售交易类型', '新零售发货门店id', '新零售发货门店名称', '新零售导购门店id', '新零售导购门店名称',
       '是否上传合同照片', '是否上传小票', '是否代付', '是否手机订单', '是否是O2O交易', '物流公司', '物流单号 ',
       '特权订金订单id', '确认收货时间', '联系手机', '联系电话 ', '订单付款时间', '订单关闭原因', '订单创建时间',
       '订单备注', '订单状态', '运送方式', '返点积分', '退款金额', '数据采集时间'],


...

from sklearn.cluster import KMeans

# 将聚类结果添加到原始数据中
data['Cluster'] = labels


0	13015181676	55.86	1	0
1	13019108165	0.00	2	0
2	13020140119	95.76	2	0
3	13022508850	48.86	1	0
4	13026161372	268.00	1	0


# 计算RFM得分
rfm_table['R'] = rfm_table['Recency'].apply(rfm_score, args=('Recency', quantiles))
rfm_table['F'] = rfm_table['Frequency'].apply(rfm_score, args=('Frequency', quantiles))
rfm_table['M'] = rfm_table['Monetary'].apply(rfm_score, args=('Monetary', quantiles))

# 输出RFM分析结果
print(rfm_table)


top_customers[rfm_table['RFM']>10]


403109394@qq.com	2463	3	1206.0	4	4	4	12
1003673371@qq.com	2406	4	1474.0	4	4	4	12
13524685268	2306	5	804.0	4	4	4	12
794378248@qq.com	2425	3	763.5	4	4	4	12
13467712448	2453	3	670.0	4	4	4	12
...	...	...	...	...	...	...	...
313137525@qq.com	2249	7	2546.0	3	4	4	11
15976850599	2204	3	867.0	3	4	4	11
18580706707	2217	15	4020.0	3	4	4	11
18771060321	2445	2	368.0	4	3	4	11
15997278777	2478	2	1034.4	4	3	4	11
相关推荐
星川皆无恙17 天前
大数据k-means聚类算法:基于k-means聚类算法+NLP微博舆情数据爬虫可视化分析推荐系统(新版)
大数据·人工智能·爬虫·算法·机器学习·自然语言处理·kmeans
天行健,君子而铎17 天前
自适应分类·高准确率·可视化易用——运营商数据分类分级解决方案
大数据·分类
装不满的克莱因瓶17 天前
了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解
人工智能·pytorch·python·深度学习·机器学习·分类·数据挖掘
装不满的克莱因瓶18 天前
掌握语义分割经典模型 FCN——从像素分类到端到端分割的奠基之作
人工智能·python·深度学习·算法·机器学习·分类·数据挖掘
deephub18 天前
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
人工智能·机器学习·kmeans·聚类·rag
雷工笔记18 天前
MES系列51-人防门行业 MES 质检分类体系
人工智能·分类·数据挖掘
2401_8856651918 天前
从零搭建CNN到迁移学习:以食物分类为例深入理解PyTorch图像分类实战
人工智能·pytorch·深度学习·分类·cnn·迁移学习
百胜软件@百胜软件18 天前
货品“精”营:ABC-XYZ分类如何驱动鞋服全渠道库存效率革命?
人工智能·分类·数据挖掘·零售数字化·数智中台·珠宝行业
zcg194218 天前
分类中的样本不平衡问题——Asymmetric Loss
人工智能·分类·数据挖掘
daly52019 天前
人工智能专业有哪些?2026高考报考指南(专业分类 + 课程 + 就业全解析)
人工智能·分类·高考