大数据应用开发和项目实战-电商双11美妆数据分析2

数据可视化

使用seaborn库绘制复杂图表,展示各品牌和品类的销售情况。

绘制嵌套柱形图,分别按主类别和子类别进行对比。

通过饼图展示男士专用产品的销售偏好,发现男士主要关注清洁和补水类产品。

用seaborn包给出每个店铺各个大类以及各个小类的销量销售额

先观察销量,各店小类中销量最高的是相宜本草的补水类商品以及妮维雅的清洁类商品,这两类销量很接近。而销售额上,相宜本草的补水类商品比妮维雅的清洁类商品要高得多,这显然是商品平均单价不同所导致的。由于不同的类别使用量也不同,销量自然也会有所区别,所以相对于比较每个店铺的不同类别的销售量,比较每个不同类别的各店铺的销售量应该更有价值。

性别偏好分析

男士专用产品

男士专用产品的销售量和销售额分别占总销售量和总销售额的18.16%和10%。

男士专用产品主要集中在护肤品,尤其是妮维雅和欧莱雅。

与之前的饼图相比,能发现什么?

男士的销量基本来自于清洁类,其次是补水类。而这两类正是总销量中占比最高的两类。

非男士专用中,补水类成为了销量最高的类别,清洁类降到了第二位。

男士专用的销量以及销售额占比都比较低。

显然,在没有区分性别的情况下,由于清洁类是男性女性通用,所以占得销量最高是理所应当的。而非男士专用中,女性消费者较多,所以补水类一跃成为最高销量。

尽管就整个销量而言,男士专用的占比不高,但是这也说明男性市场是一个值得发展急需拓宽的点。如果增加更多关于男性护肤品的推广,有可能会吸引更多的男性消费者从而增加销量。所以进一步分析,各个店铺的男性专用商品的销量。

男士专用护肤品的销售量前三名分别是:妮维雅,欧莱雅,相宜本草。所有男士商品主要销量来自于护肤品。对于其他类这里暂时不进行分析,因为其产生大概率是basic_data也就是我们的分类集不完善导致的。观察一下男用化妆品的数据,如下:

可以看出基本都是男用唇膏。因为将唇膏归于了口红类,而口红类归于了化妆品类。

接下来看看各个店铺的男士专用商品的总销量销售额是怎样的 :

女士专用产品

从前面数据看出来,女士产品的销售量和销售额分布较为均衡,主要集中在相宜本草、美宝莲、悦诗风吟和欧莱雅。跟男士不一样。

时间序列分析

销售量与销售额的时间变化

观察两个折线图,其走势是相同的,因为整个销量与销售额应该是成正相关的。

图形有如下特点:

在9日单日销售量达到峰值,而在11日达到最小

10日之前的波动趋势相对稳定,在11日有一个急剧的下降

11日过后又开始缓慢的增长。由于统计的日期有限,无法判断这种趋势是长期的还是短期的。

++建议商家在销售量高峰前几天安排促销活动,以最大化销售额。++

数据分析项目的四个步骤:

数据采集:可以通过爬虫或使用开源数据集。

数据探索:使用numpy和panda进行初步的数据了解和处理。

数据预处理:处理重复值、缺失值和异常值。

数据可视化 :根据预处理后的数据进行++图表绘制和分析++(可视化)

数据分析的重要性和实际应用

通过数据分析和可视化可以发现潜在的商业机会和消费者偏好。

数据分析结果,建议商家优化产品组合和促销策略,以提高销售额和客户满意度。

相关推荐
源码之家7 小时前
基于Python房价预测系统 数据分析 Flask框架 爬虫 随机森林回归预测模型、链家二手房 可视化大屏 大数据毕业设计(附源码)✅
大数据·爬虫·python·随机森林·数据分析·spark·flask
TDengine (老段)8 小时前
什么是 TDengine IDMP?
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
谅望者8 小时前
数据分析笔记08:Python编程基础-数据类型与变量
数据库·笔记·python·数据分析·概率论
Apache Flink8 小时前
Flink Forward Asia 2025 城市巡回 · 深圳站
大数据·flink
Hello.Reader8 小时前
Flink DataStream API 打包使用 MySQL CDC 连接器
大数据·mysql·flink
2021_fc8 小时前
Flink入门指南:使用Java构建第一个Flink应用
java·大数据·flink
Hello.Reader8 小时前
Streaming ELT with Flink CDC · Iceberg Sink
大数据·flink
RPA机器人就选八爪鱼8 小时前
RPA财务机器人:驱动财务数字化转型的核心引擎
大数据·运维·人工智能·机器人·rpa
2021_fc8 小时前
Flink快速入门--安装与示例运行
大数据·flink
J***Q2929 小时前
大数据存储优化策略
大数据