11-天猫订单数据分析

目录

前言

一、导入

二、使用步骤

1.数据清洗

2.对订单状况进行分析

3.每种订单数占比情况

饼图：

不同省份订单分析地图：

不同省份金额分析柱状图：

散点图：

总结

前言

天猫订单数据分析可以从多个角度进行分析，以下是一些常见的分析维度和方法：

基本统计分析：可以对订单数量、销售额、平均订单金额等进行基本统计分析，以了解整体的销售情况和趋势。
地域分析：可以根据订单的收货地址, 分析订单的地域分布情况，了解不同地区的销售情况和潜力。
时间分析：可以根据订单的下单时间、付款时间等，进行时间分析，了解不同时间段的订单量和销售额变化情况，以及不同时间段的用户行为和消费习惯。
用户行为分析：可以根据用户的购买频次、购买金额、购买种类等，进行用户行为分析，了解用户的购买习惯和偏好，以及不同用户群体的消费特征。
产品分析：可以根据产品的销售数量、销售额、销售排名等，对产品进行分析，了解产品的市场表现和受欢迎程度，进而指导产品的进一步发展和优化。
渠道分析：可以根据不同的营销渠道，如搜索引擎、社交媒体等，进行渠道分析，了解不同渠道的转化率、ROI等指标，为优化营销策略提供依据。

一、导入

复制代码

import numpy as np
import pandas as pd

二、使用步骤

1.数据清洗

代码如下（示例）：

python 复制代码

data = pd.read_excel(r'C:\Users\B\Desktop\天猫订单.xlsx')
data.head()

data.info()

data.describe(include='all')

# 删除重复值
data.drop_duplicates(inplace=True)

data['星期'] = data['订单付款时间'].dt.dayofweek+1
data['小时'] = data['订单付款时间'].dt.hour
data


data['收货地址'].unique()  # 获取唯一值

data['收货地址'] = data['收货地址'].str.replace('上海','上海市')
data['收货地址'] = data['收货地址'].str.replace('重庆','重庆市')
data['收货地址'] = data['收货地址'].str.replace('北京','北京市')
data['收货地址'] = data['收货地址'].str.replace('天津','天津市')

2.对订单状况进行分析

代码如下（示例）：

python 复制代码

# 有效订单：有付款，没有退款
valid_order = data[(data['订单付款时间'].notnull()) & (data['退款金额']==0)]
valid_order



# 退款订单：有付款，有退款
refund_order = data[data['退款金额']>0]
refund_order



# 未付款订单：没有付款
unpaid_order = data[data['订单付款时间'].isnull()]
unpaid_order   # NaT not a time 时间空值  NaN  not a number 数字空值

3.每种订单数占比情况

复制代码

from pyecharts.charts import *
import pyecharts.options as opts

饼图：

python 复制代码

pie_data = [('有效订单',len(valid_order)),('退款订单',len(refund_order)),('未付款订单',len(unpaid_order))]
pie_data




pie =(
    Pie()
    .add('订单',pie_data,
        label_opts=opts.LabelOpts(formatter='{b}:{d}%',font_size=15))
    .set_global_opts(title_opts=opts.TitleOpts(title='各订单占比分析',
                                               title_textstyle_opts=opts.TextStyleOpts(font_size=30,color='green'))
                    )
)
pie.render_notebook()

不同省份订单分析地图：

python 复制代码

data2 = data[data['订单付款时间'].notnull()]

# 按省份统计订单量 name='订单量'把原来的值列改列名为'订单量'
province_order_count = data2.groupby('收货地址')['订单金额'].count().reset_index(name='订单量') 



# 转成数据对
data_pair = dict(zip(province_order_count['收货地址'].tolist(),province_order_count['订单量'].tolist()))

data_pair



# 全国订单量地图

map = (
    Map()
    .add("",
    [list(x) for x in data_pair.items()],
         maptype='china',
         is_map_symbol_show=False
    )
    # 视角配置项 --- 可选项
    .set_global_opts(
        visualmap_opts=opts.VisualMapOpts(is_show=True,min_=0,max_=3100,range_color=['red','orange','yellow','green','blue','indigo','violet'])
    )
    # 设置每块的阴影 
    .set_series_opts(itemstyle_opts=opts.TextStyleOpts(shadow_color="rgba(255,255,255,0.6)",shadow_blur=20)
    )
)

map.render_notebook()

不同省份金额分析柱状图：

python 复制代码

province_payment = data2.groupby('收货地址')[['订单金额','实付金额','退款金额']].sum().reset_index()
province_payment



# 把单位改成万
province_payment['订单金额']= province_payment['订单金额']/10000
province_payment['实付金额']= province_payment['实付金额']/10000
province_payment['退款金额']= province_payment['退款金额']/10000
# 按订单金额进行降序排序
province_payment.sort_values(ascending=False,by='订单金额',inplace=True)



bar = (
    Bar()
    .add_xaxis(province_payment['收货地址'].tolist())
    # stack=True 柱状图堆叠  category_gap柱子间的间隙的比例
    .add_yaxis('实付金额',round(province_payment['实付金额'],2).tolist(),stack=True,category_gap='30%')
    .add_yaxis('退款金额',round(province_payment['退款金额'],2).tolist(),stack=True,category_gap='30%')
    
    .set_global_opts(
        xaxis_opts=opts.AxisOpts(name='省份',axislabel_opts={'rotate':90}),#给x轴添加名称，并旋转x轴标签
        datazoom_opts=[opts.DataZoomOpts()] # 缩放条
    )
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False)) # 去掉柱状图标签
)

# 订单金额 
effect = (
    EffectScatter()
    .add_xaxis(province_payment['收货地址'].tolist())
    .add_yaxis('订单金额',round(province_payment['订单金额'],2).tolist())
    .set_series_opts(label_opts=opts.LabelOpts(position='top'))
)
# 层叠图
overlap = bar.overlap(effect)
grid = Grid()
grid.add(overlap,grid_opts=opts.GridOpts(pos_top='35%'))
grid.render_notebook()

散点图：

python 复制代码

effect = (
    EffectScatter()
    .add_xaxis(province_payment['收货地址'].tolist())
    .add_yaxis('订单金额',round(province_payment['订单金额'],2).tolist())
    .set_series_opts(label_opts=opts.LabelOpts(position='top'))
)
effect.render_notebook()

总结

以上只是一些常见的分析维度和方法，具体的分析内容和方法还需要根据实际情况来确定，同时要结合实际业务场景和需求，进行深入的数据分析和挖掘。