操作教程|基于DataEase用RFM分析法分析零售交易数据

DataEase开源BI工具可以在店铺运营的数据分析及可视化方面提供非常大的帮助。同样,在用于客户评估的RFM(即Recency、Frequency和Monetary的简称)分析中,DataEase也可以发挥出积极的价值,通过数据可视化大屏的方式实时展示分析结果,让业务数据在没有损耗准确性和时效性的前提下,以更加直观易懂的方式呈现。

关于RFM分析法

RFM分析法是一种经典的客户价值评估模型,广泛应用于市场营销和客户关系管理领域。通过分析客户最近一次的消费时间(Recency)、消费频率(Frequency)以及消费金额(Monetary),RFM模型能够精准识别客户的价值和行为特征。这一方法在零售、新消费和电商行业尤为普遍和通用,可以帮助企业识别高价值客户、制定个性化营销策略、提升客户满意度和忠诚度,并且优化资源配置,从而显著提升整体销售业绩和市场竞争力。

RFM分析不仅为企业提供了科学的数据支持,还在客户关系管理中起到了关键的指导作用。其中,针对"R"、"F"和"M"这三个维度,可以根据如下标准来做出评估:

1.R(Recency):表示客户最近一次购买时间距离当前时间的间隔天数。时间越短,客户的活跃度越高,越有可能再次购买;

2.F(Frequency):表示客户在特定时间段内的购买次数。次数越多,说明客户与公司的互动越频繁,忠诚度越高;

3.M(Monetary):表示客户在特定时间段内的总消费金额。金额越高,客户的价值越大,越会成为公司重要的利润来源。

通过DataEase对数据进行RFM分析

本文为您介绍通过DataEase对数据开展RFM分析的方法,涵盖了数据收集、处理,到客户分群和策略制定的完整步骤。

一、数据收集

在进行具体的数据分析之前,首先需要采集、整理好待分析的客户交易数据,包括每笔交易的日期、交易金额和客户ID等字段。

以下是模拟的一份零售交易数据示例。

▲图1 模拟零售交易数据

将获得的数据导入数据库。此处我们将模拟生成的数据加载至Oracle数据库中,具体步骤如下:

1.通过SQL命令语句创建生成数据表。

c 复制代码
CREATE TABLE transactions (
       transaction_id NUMBER PRIMARY KEY,
       customer_id NUMBER NOT NULL,
       product_id NUMBER NOT NULL,
       transaction_time TIMESTAMP NOT NULL,
       total_amount NUMBER(10, 2) NOT NULL
);

2.将待分析的数据导入至生成好的数据表"TRANSACTIONS"中。

▲图2 将数据导入数据库的数据表

二、数据处理与计算

本次我们将通过DataEase开源BI工具来进行RFM分析数据的大屏制作,以实现数据的直观展示与分析。

具体步骤如下:

1.在DataEase的"数据源配置"页面,选择连接对应的Oracle数据库。

▲图3 连接Oracle数据源

2.使用Oracle数据源中预先准备好的数据表"TRANSACTIONS",创建数据集。

▲图4 数据集创建操作

3.从数据表"TRANSACTIONS"中拆分出具体的"R"、"F"、"M"三个维度,并根据它们各自的指示特征,对数据进行进一步的筛选和加工处理。

■ R:用当前时间减去最近交易时间,并将结果向上取整,获取上次消费间隔天数;

c 复制代码
CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R

■ F:当月内的发生交易次数;

c 复制代码
COUNT(1) AS F

■ M:当月内消费金额合计。

c 复制代码
SUM(TOTAL_AMOUNT) AS M

在DataEase中,可以便利地通过"新建计算字段"功能来加工以上字段,实现数据的快速处理。

▲图5 DataEase的"新建计算字段"功能

4.按照客户ID来汇总数据,并对数据进行排序,取得可以用于RFM分析的数据集。

c 复制代码
SELECT
       CUSTOMER_ID,
       CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R,
       COUNT(1) AS F,
       SUM(TOTAL_AMOUNT) AS M
FROM
       TRANSACTIONS
GROUP BY
       CUSTOMER_ID
ORDER BY
       CUSTOMER_ID

▲图6 用于RFM分析的数据集

三、数据标准划分

使用SQL语句,对待分析的数据进行进一步的处理,根据客户行为指标所在的数值区间分出计分等级。

c 复制代码
SELECT
       MIN(t.R) 最小最近间隔天数,
       MAX(t.R) 最大最近间隔天数,
       MIN(t.F) 最小消费次数,
       MAX(t.F) 最大消费次数,
       MIN(t.M) 最小合计金额,
       MAX(t.M) 最大合计金额
FROM
       (
       SELECT
              CUSTOMER_ID,
              CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R,
              COUNT(1) AS F,
              SUM(TOTAL_AMOUNT) AS M
       FROM
              TRANSACTIONS
       GROUP BY
              CUSTOMER_ID
       ORDER BY
              CUSTOMER_ID)t

▲图7 数据计分标准参考

此处我们使用均等分层的方式,将客户交易数据分出等级,作为顺序数据计分。

■ R:

5分:1-4天

4分:5-8天

3分:9-12天

2分:13-16天

1分:17天以上

■ F:

5分:20次以上

4分:16-20次

3分:11-15次

2分:6-10次

1分:1-5次

■ M:

5分:8001以上

4分:6001-8000元

3分:4001-6000元

2分:2001-4000元

1分:1-2000元

四、客户分群

根据已经确定的数据标准,使用SQL语句对数据进行如下分类。

1.为R、F、M数值分别分层计分,所得R、F、M数值对应的分数分别记录为计分字段"R_GRD"、"F_GRD"、"M_GRD"。

c 复制代码
SELECT
       t.CUSTOMER_ID,
       t.R,
       CASE
              WHEN t.R BETWEEN 1 AND 4 THEN 5
              WHEN t.R BETWEEN 5 AND 8 THEN 4
              WHEN t.R BETWEEN 9 AND 12 THEN 3
              WHEN t.R BETWEEN 13 AND 16 THEN 2
              WHEN t.R > 16 THEN 1
       END R_Grd,
       t.F,
       CASE
              WHEN t.F BETWEEN 1 AND 5 THEN 1
              WHEN t.F BETWEEN 6 AND 10 THEN 2
              WHEN t.F BETWEEN 11 AND 15 THEN 3
              WHEN t.F BETWEEN 16 AND 20 THEN 4
              WHEN t.F > 20 THEN 5
       END F_Grd,
       t.M,
       CASE
              WHEN t.M BETWEEN 1 AND 2000 THEN 1
              WHEN t.M BETWEEN 2001 AND 4000 THEN 2
              WHEN t.M BETWEEN 4001 AND 6000 THEN 3
              WHEN t.M BETWEEN 6001 AND 8000 THEN 4
              WHEN t.M > 8000 THEN 5
       END M_Grd
FROM
       (
       SELECT
              CUSTOMER_ID,
              CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R,
              COUNT(1) AS F,
              SUM(TOTAL_AMOUNT) AS M
       FROM
              TRANSACTIONS
       GROUP BY
              CUSTOMER_ID
       ORDER BY
              CUSTOMER_ID)t

▲图8 新增"GRD"计分字段

2.分别计算出"R_GRD"、"F_GRD"、"M_GRD"三个字段的平均值。

c 复制代码
SELECT
       AVG(ag.R_Grd) R_avg,
       AVG(ag.F_Grd) F_avg,
       AVG(ag.M_Grd) M_avg
FROM
       (
       SELECT
              t.CUSTOMER_ID,
              t.R,
              CASE
                     WHEN t.R BETWEEN 1 AND 4 THEN 5
                     WHEN t.R BETWEEN 5 AND 8 THEN 4
                     WHEN t.R BETWEEN 9 AND 12 THEN 3
                     WHEN t.R BETWEEN 13 AND 16 THEN 2
                     WHEN t.R > 16 THEN 1
              END R_Grd,
              t.F,
              CASE
                     WHEN t.F BETWEEN 1 AND 5 THEN 1
                     WHEN t.F BETWEEN 6 AND 10 THEN 2
                     WHEN t.F BETWEEN 11 AND 15 THEN 3
                     WHEN t.F BETWEEN 16 AND 20 THEN 4
                     WHEN t.F > 20 THEN 5
              END F_Grd,
              t.M,
              CASE
                     WHEN t.M BETWEEN 1 AND 2000 THEN 1
                     WHEN t.M BETWEEN 2001 AND 4000 THEN 2
                     WHEN t.M BETWEEN 4001 AND 6000 THEN 3
                     WHEN t.M BETWEEN 6001 AND 8000 THEN 4
                     WHEN t.M > 8000 THEN 5
              END M_Grd
       FROM
              (
              SELECT
                     CUSTOMER_ID,
                     CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R,
                     COUNT(1) AS F,
                     SUM(TOTAL_AMOUNT) AS M
              FROM
                     TRANSACTIONS
              GROUP BY
                     CUSTOMER_ID
              ORDER BY
                     CUSTOMER_ID)t)ag

▲图9 计算"GRD"字段平均值

3.将"R_GRD"、"F_GRD"、"M_GRD"分数与各自的字段平均值进行对比,得出对应的等级字段"R_RNK"、"F_RNK"、"M_RNK"。若"GRD"分数高于平均值,则记录"RNK"为"高",反之则记录"RNK"为"低"。

c 复制代码
SELECT
       t.CUSTOMER_ID,
       t.R,
       CASE
              WHEN t.R BETWEEN 1 AND 4 THEN 5
              WHEN t.R BETWEEN 5 AND 8 THEN 4
              WHEN t.R BETWEEN 9 AND 12 THEN 3
              WHEN t.R BETWEEN 13 AND 16 THEN 2
              WHEN t.R > 16 THEN 1
       END R_Grd,
       CASE
              WHEN (CASE
                     WHEN t.R BETWEEN 1 AND 4 THEN 5
                     WHEN t.R BETWEEN 5 AND 8 THEN 4
                     WHEN t.R BETWEEN 9 AND 12 THEN 3
                     WHEN t.R BETWEEN 13 AND 16 THEN 2
                     WHEN t.R > 16 THEN 1
              END) > 3.441 THEN '高'
              ELSE '低'
       END R_Rnk,
       t.F,
       CASE
              WHEN t.F BETWEEN 1 AND 5 THEN 1
              WHEN t.F BETWEEN 6 AND 10 THEN 2
              WHEN t.F BETWEEN 11 AND 15 THEN 3
              WHEN t.F BETWEEN 16 AND 20 THEN 4
              WHEN t.F > 20 THEN 5
       END F_Grd,
       CASE
              WHEN (CASE
                     WHEN t.F BETWEEN 1 AND 5 THEN 1
                     WHEN t.F BETWEEN 6 AND 10 THEN 2
                     WHEN t.F BETWEEN 11 AND 15 THEN 3
                     WHEN t.F BETWEEN 16 AND 20 THEN 4
                     WHEN t.F > 20 THEN 5
              END) > 2.751 THEN '高'
              ELSE '低'
       END F_Rnk,
       t.M,
       CASE
              WHEN t.M BETWEEN 1 AND 2000 THEN 1
              WHEN t.M BETWEEN 2001 AND 4000 THEN 2
              WHEN t.M BETWEEN 4001 AND 6000 THEN 3
              WHEN t.M BETWEEN 6001 AND 8000 THEN 4
              WHEN t.M > 8000 THEN 5
       END M_Grd,
       CASE
              WHEN (CASE
                     WHEN t.M BETWEEN 1 AND 2000 THEN 1
                     WHEN t.M BETWEEN 2001 AND 4000 THEN 2
                     WHEN t.M BETWEEN 4001 AND 6000 THEN 3
                     WHEN t.M BETWEEN 6001 AND 8000 THEN 4
                     WHEN t.M > 8000 THEN 5
              END) > 2.852 THEN '高'
              ELSE '低'
       END M_Rnk
FROM
       (
       SELECT
              CUSTOMER_ID,
              CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R, 
              COUNT(1) AS F,
              SUM(TOTAL_AMOUNT) AS M
       FROM
              TRANSACTIONS
       GROUP BY
              CUSTOMER_ID
       ORDER BY
              CUSTOMER_ID)t

▲图10 新增"RNK"等级字段

五、分析与策略

根据上一步获得的"RNK"等级评估标准对用户类型进行细分,获取用户画像,并且分别制定对应的策略。

基于用户画像分析,在数据表中新增"RFM-RNK"(客户分类)字段,定位客户类型。

c 复制代码
SELECT
       rfm.*,
       CASE
              WHEN rfm.R_RNK = '高'
              AND rfm.F_RNK = '高'
              AND rfm.M_RNK = '高' THEN '重要价值客户'
              WHEN rfm.R_RNK = '高'
              AND rfm.F_RNK = '低'
              AND rfm.M_RNK = '高' THEN '重要发展客户'
              WHEN rfm.R_RNK = '低'
              AND rfm.F_RNK = '高'
              AND rfm.M_RNK = '高' THEN '重要保持客户'
              WHEN rfm.R_RNK = '低'
              AND rfm.F_RNK = '低'
              AND rfm.M_RNK = '高' THEN '重要挽留客户'
              WHEN rfm.R_RNK = '高'
              AND rfm.F_RNK = '高'
              AND rfm.M_RNK = '低' THEN '一般价值客户'
              WHEN rfm.R_RNK = '高'
              AND rfm.F_RNK = '低'
              AND rfm.M_RNK = '低' THEN '一般保持客户'
              WHEN rfm.R_RNK = '低'
              AND rfm.F_RNK = '高'
              AND rfm.M_RNK = '低' THEN '一般保持客户'
              WHEN rfm.R_RNK = '低'
              AND rfm.F_RNK = '低'
              AND rfm.M_RNK = '低' THEN '一般挽留客户'
       END rfm_Rnk
FROM
       (
       SELECT
              t.CUSTOMER_ID,
              t.R,
              CASE
                     WHEN t.R BETWEEN 1 AND 4 THEN 5
                     WHEN t.R BETWEEN 5 AND 8 THEN 4
                     WHEN t.R BETWEEN 9 AND 12 THEN 3
                     WHEN t.R BETWEEN 13 AND 16 THEN 2
                     WHEN t.R > 16 THEN 1              
              END R_Grd,
              CASE
                     WHEN (CASE
                            WHEN t.R BETWEEN 1 AND 4 THEN 5
                            WHEN t.R BETWEEN 5 AND 8 THEN 4
                            WHEN t.R BETWEEN 9 AND 12 THEN 3
                            WHEN t.R BETWEEN 13 AND 16 THEN 2
                            WHEN t.R > 16 THEN 1
                     END) > 3.441 THEN '高'
                     ELSE '低'
              END R_Rnk,
              t.F,
              CASE
                     WHEN t.F BETWEEN 1 AND 5 THEN 1
                     WHEN t.F BETWEEN 6 AND 10 THEN 2
                     WHEN t.F BETWEEN 11 AND 15 THEN 3
                     WHEN t.F BETWEEN 16 AND 20 THEN 4
                     WHEN t.F > 20 THEN 5
              END F_Grd,
              CASE
                     WHEN (CASE
                            WHEN t.F BETWEEN 1 AND 5 THEN 1
                            WHEN t.F BETWEEN 6 AND 10 THEN 2
                            WHEN t.F BETWEEN 11 AND 15 THEN 3
                            WHEN t.F BETWEEN 16 AND 20 THEN 4
                            WHEN t.F > 20 THEN 5
                     END) > 2.751 THEN '高'
                     ELSE '低'
              END F_Rnk,
              t.M,
              CASE
                     WHEN t.M BETWEEN 1 AND 2000 THEN 1
                     WHEN t.M BETWEEN 2001 AND 4000 THEN 2
                     WHEN t.M BETWEEN 4001 AND 6000 THEN 3
                     WHEN t.M BETWEEN 6001 AND 8000 THEN 4
                     WHEN t.M > 8000 THEN 5
              END M_Grd,
              CASE
                     WHEN (CASE
                            WHEN t.M BETWEEN 1 AND 2000 THEN 1
                            WHEN t.M BETWEEN 2001 AND 4000 THEN 2
                            WHEN t.M BETWEEN 4001 AND 6000 THEN 3
                            WHEN t.M BETWEEN 6001 AND 8000 THEN 4
                            WHEN t.M > 8000 THEN 5
                     END) > 2.852 THEN '高'
                     ELSE '低'
              END M_Rnk
FROM
       (
       SELECT
              CUSTOMER_ID,
              CEIL(SYSDATE - MAX(TRANSACTION_TIME)) AS R, 
              COUNT(1) AS F,
              SUM(TOTAL_AMOUNT) AS M
       FROM
              TRANSACTIONS
       GROUP BY
              CUSTOMER_ID
       ORDER BY
              CUSTOMER_ID)t)rfm

▲图11 新增"RFM-RNK"客户分类字段

六、用户画像可视化

基于前述数据分析的结果,并且结合店铺自身的业务场景,我们可以引入VIP客户占比、沉睡客户占比等关键绩效指标。这些指标对于深入了解客户群体结构和行为模式至关重要,能够帮助我们更加精准地把握营销侧重的方向。

针对以上整个RFM分析中的关键数据指标,我们可以利用DataEase强大的数据可视化呈现能力构建如下定制化的数据大屏,综合展示这些关键指标的实时动态,为运营人员提供一目了然的可视化效果,并且通过多维度的数据透视和交互功能,深入挖掘数据背后的潜在业务价值。

我们也可以通过定期更新的数据大屏,去实时监控不同类型客户的活跃度和贡献度,识别并维护高价值客户。同时,通过沉睡客户的占比分析,我们可以制定针对性的激活策略,挖掘潜在的客户消费机会。

▲图12 基于DataEase构建的"用户画像-RFM分析法"数据大屏

RFM分析数据大屏的构建有助于我们更精准地了解客户需求和市场变化,也能为制定更加细致的市场运营策略提供坚实的数据基础,让营销决策变得更加高效和科学。

注:本文所引用的RFM分析相关定义来源于《数据分析思维:分析方法和业务知识》一书,猴子.数据分析学院著。

相关推荐
lsjweiyi15 小时前
极简AI工具箱网站开源啦!
opencv·开源·微信支付·支付宝支付·百度ai·极简ai工具箱·ai图像处理
开源社16 小时前
一场开源视角的AI会议即将在南京举办
人工智能·开源
FreeIPCC16 小时前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源
海害嗨16 小时前
阿里巴巴官方「SpringCloudAlibaba全彩学习手册」限时开源!
学习·开源
生命是有光的16 小时前
【开源风云】从若依系列脚手架汲取编程之道(八)
开源
HuggingFace18 小时前
Halo 正式开源: 使用可穿戴设备进行开源健康追踪
开源·健康追踪
B站计算机毕业设计超人21 小时前
计算机毕业设计SparkStreaming+Kafka新能源汽车推荐系统 汽车数据分析可视化大屏 新能源汽车推荐系统 汽车爬虫 汽车大数据 机器学习
数据仓库·爬虫·python·数据分析·kafka·数据可视化·推荐算法
时光追逐者21 小时前
.NET 9 中 LINQ 新增功能实操
开发语言·开源·c#·.net·.netcore·linq·微软技术
檀越剑指大厂1 天前
Linux本地部署开源项目OpenHands基于AI的软件开发代理平台及公网访问
linux·人工智能·开源
胜天半子_王二_王半仙2 天前
c++源码阅读__ThreadPool__正文阅读
开发语言·c++·开源