餐饮平台数仓建模案例

根据某餐饮平台（以餐饮企业提供数字化解决方案为核心）的业务特点，以及参考《阿里巴巴大数据之路》的数据仓库建模思想，以下是一个数仓建模的完整设计方案。

1. 平台业务分析

某餐饮平台的主要业务包括：

商家管理： 提供餐厅的信息管理、菜单设置、店铺运营分析等。
订单管理： 记录订单的下单、支付、配送等信息。
用户行为： 记录消费者在点餐、下单、支付中的行为轨迹。
营销活动： 推广促销、优惠券使用等活动数据。
配送管理： 追踪外卖订单的配送状态和时效。

数据仓库需支持以下需求：

实现多维度的业务分析（如商家经营状况、用户画像、订单数据分析）。
支持高效的报表生成和多维分析（如促销活动效果分析）。
实现实时监控和分析（如配送时效监控）。

2. 数仓分层架构

按照数仓建设分层标准，分为以下几层：

ODS层（操作数据存储层）： 原始数据存储，直接从业务系统中同步数据，不做任何逻辑处理。
DWD层（明细数据层）： 经过数据清洗后的明细数据，按业务主题划分，数据去重、标准化。
DWS层（汇总数据层）： 聚合后的主题宽表，生成核心业务指标。
ADS层（应用数据层）： 面向应用的最终分析数据，支持业务报表或实时监控。

3. 核心模型设计

根据某餐饮平台的核心业务，以下是主要的模型设计：

(1) 用户行为模型

记录用户在餐饮平台上的行为（如浏览菜单、添加购物车、下单等）。

表名： dwd_user_behavior_detail

字段设计：

字段名	类型	描述
user_id	BIGINT	用户ID
behavior_type	STRING	行为类型（浏览、加购等）
restaurant_id	BIGINT	餐厅ID
dish_id	BIGINT	菜品ID
behavior_time	TIMESTAMP	行为发生时间
platform	STRING	操作平台（APP/小程序等）

(2) 商家维度模型

记录餐厅的基础信息，包括经营范围、评分等。

表名： dim_restaurant

字段设计：

字段名	类型	描述
restaurant_id	BIGINT	餐厅ID
restaurant_name	STRING	餐厅名称
category	STRING	餐饮分类
location	STRING	所在区域
avg_rating	DECIMAL	平均评分
opening_hours	STRING	营业时间

(3) 菜品维度模型

记录餐厅菜品的基本信息，如价格、销量等。

表名： dim_dish

字段设计：

字段名	类型	描述
dish_id	BIGINT	菜品ID
dish_name	STRING	菜品名称
restaurant_id	BIGINT	餐厅ID
price	DECIMAL	菜品价格
category	STRING	菜品分类
is_promotion	BOOLEAN	是否促销

(4) 订单事实模型

记录餐饮订单的详细信息，包括订单状态、金额、时间等。

表名： dwd_order_fact

字段设计：

字段名	类型	描述
order_id	BIGINT	订单ID
user_id	BIGINT	用户ID
restaurant_id	BIGINT	餐厅ID
total_amount	DECIMAL	订单总金额
order_status	STRING	订单状态（已支付等）
order_time	TIMESTAMP	订单创建时间
delivery_time	TIMESTAMP	配送完成时间

(5) 活动营销模型

记录优惠券、折扣活动的使用情况。

表名： dwd_marketing_fact

字段设计：

字段名	类型	描述
marketing_id	BIGINT	活动ID
user_id	BIGINT	用户ID
restaurant_id	BIGINT	餐厅ID
discount_amount	DECIMAL	优惠金额
usage_time	TIMESTAMP	活动使用时间

4. 示例分析场景

场景1：用户偏好分析

分析用户最常购买的餐厅或菜品类别，构建用户画像。

SQL示例：

sql 复制代码

SELECT 
    user_id,
    category AS favorite_category,
    COUNT(*) AS purchase_count
FROM 
    dwd_order_fact AS o
JOIN 
    dim_dish AS d
ON 
    o.restaurant_id = d.restaurant_id
GROUP BY 
    user_id, category
ORDER BY 
    purchase_count DESC;

场景2：餐厅经营分析

分析餐厅的订单量和总收入，评估经营状况。

SQL示例：

sql 复制代码

SELECT 
    restaurant_id,
    COUNT(order_id) AS total_orders,
    SUM(total_amount) AS total_revenue
FROM 
    dwd_order_fact
WHERE 
    order_status = '已完成'
GROUP BY 
    restaurant_id
ORDER BY 
    total_revenue DESC;

场景3：配送时效分析

统计配送超时率，监控配送效率。

SQL示例：

sql 复制代码

SELECT 
    COUNT(*) AS total_orders,
    SUM(CASE WHEN TIMESTAMPDIFF(MINUTE, order_time, delivery_time) > 30 THEN 1 ELSE 0 END) AS delayed_orders,
    ROUND(SUM(CASE WHEN TIMESTAMPDIFF(MINUTE, order_time, delivery_time) > 30 THEN 1 ELSE 0 END) / COUNT(*) * 100, 2) AS delay_rate
FROM 
    dwd_order_fact
WHERE 
    delivery_time IS NOT NULL;

5. 建模优化建议

宽表设计： 根据实际需求，将用户行为、订单、餐厅信息聚合成宽表，提高分析效率。
数据分区： 按日期对订单数据分区，以优化查询性能。
实时分析： 使用Kafka + Flink，构建用户行为实时分析的流式处理。
指标预计算： 在DWS层提前计算常用指标（如GMV、订单量），减少报表生成压力。

这个模型设计充分考虑了某餐饮平台的业务特点和实际分析需求，既支持离线分析，也可以扩展为实时监控系统。