【BXZ_231228】使用Sklearn Kmeans及RFM对淘宝客户进行分类关怀

复制代码
import random
import string
from datetime import datetime

def generate_random_string(length=3):
    characters = string.ascii_uppercase
    return ''.join(random.choice(characters) for _ in range(length))

def generate_timestamped_string(separator='_'):
    timestamp = datetime.now().strftime('%y%m%d') # %H%M%S
    random_part = generate_random_string(length=3)
    return random_part+separator+timestamp

timestamped_string = generate_timestamped_string()
print('【{0}】'.format(timestamped_string))

【Talk is cheap】

复制代码
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文
plt.rcParams['axes.unicode_minus'] = False # 显示负号
warnings.filterwarnings("ignore")
%matplotlib inline

...
Index(['买家会员名', '买家实际支付积分', '买家实际支付金额', '买家应付货款', '买家应付邮费', '买家支付宝账号',
       '买家支付积分', '买家服务费', '买家留言', '修改后的sku', '修改后的收货地址', '分阶段订单信息', '卖家服务费',
       '发票抬头', '含应开票给个人的个人红包', '天猫卡券抵扣', '定金排名', '宝贝总数量', '宝贝标题 ', '宝贝种类 ',
       '店铺Id', '店铺名称', '异常信息', '总金额', '打款商家金额', '支付单号', '支付详情', '收货人姓名',
       '收货地址', '新零售交易类型', '新零售发货门店id', '新零售发货门店名称', '新零售导购门店id', '新零售导购门店名称',
       '是否上传合同照片', '是否上传小票', '是否代付', '是否手机订单', '是否是O2O交易', '物流公司', '物流单号 ',
       '特权订金订单id', '确认收货时间', '联系手机', '联系电话 ', '订单付款时间', '订单关闭原因', '订单创建时间',
       '订单备注', '订单状态', '运送方式', '返点积分', '退款金额', '数据采集时间'],


...

from sklearn.cluster import KMeans

# 将聚类结果添加到原始数据中
data['Cluster'] = labels


0	13015181676	55.86	1	0
1	13019108165	0.00	2	0
2	13020140119	95.76	2	0
3	13022508850	48.86	1	0
4	13026161372	268.00	1	0


# 计算RFM得分
rfm_table['R'] = rfm_table['Recency'].apply(rfm_score, args=('Recency', quantiles))
rfm_table['F'] = rfm_table['Frequency'].apply(rfm_score, args=('Frequency', quantiles))
rfm_table['M'] = rfm_table['Monetary'].apply(rfm_score, args=('Monetary', quantiles))

# 输出RFM分析结果
print(rfm_table)


top_customers[rfm_table['RFM']>10]


403109394@qq.com	2463	3	1206.0	4	4	4	12
1003673371@qq.com	2406	4	1474.0	4	4	4	12
13524685268	2306	5	804.0	4	4	4	12
794378248@qq.com	2425	3	763.5	4	4	4	12
13467712448	2453	3	670.0	4	4	4	12
...	...	...	...	...	...	...	...
313137525@qq.com	2249	7	2546.0	3	4	4	11
15976850599	2204	3	867.0	3	4	4	11
18580706707	2217	15	4020.0	3	4	4	11
18771060321	2445	2	368.0	4	3	4	11
15997278777	2478	2	1034.4	4	3	4	11
相关推荐
郝学胜-神的一滴36 分钟前
二分类任务核心:BCE 损失函数从原理到 PyTorch 实战
人工智能·pytorch·python·算法·机器学习·分类·数据挖掘
啦啦啦_99992 天前
2. 分类问题的评估
人工智能·分类·数据挖掘
糖果店的幽灵2 天前
决策树详解与sklearn实战
算法·决策树·sklearn
ting94520002 天前
动手学深度学习(PyTorch版)深度详解(6):现代卷积神经网络-从经典模型到图像分类实战
人工智能·分类·cnn
Mr数据杨2 天前
花卉图像分类在植物识别与生态监测中的应用
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
DeniuHe2 天前
sklearn.utils.validation.check_random_state 详解
人工智能·python·sklearn
qq_283720052 天前
基于 Transformer,Python 搭建中文文本分类大模型:从零到一实现企业级文本分类
python·分类·transformer
电科一班林耿超2 天前
机器学习大师课 第 4 课:分类问题入门 —— 逻辑回归(垃圾邮件分类实战)
人工智能·机器学习·分类·逻辑回归
nonono2 天前
深度学习基础——(3)视觉处理基础实战【CNN实现CIFAR10 多分类】
深度学习·分类·cnn
@insist1232 天前
信息安全工程师考点精讲:身份认证核心原理与分类体系(上篇)
大数据·网络·分类·信息安全工程师·软件水平考试