数据可视化
使用seaborn库绘制复杂图表,展示各品牌和品类的销售情况。
绘制嵌套柱形图,分别按主类别和子类别进行对比。
通过饼图展示男士专用产品的销售偏好,发现男士主要关注清洁和补水类产品。
用seaborn包给出每个店铺各个大类以及各个小类的销量销售额



先观察销量,各店小类中销量最高的是相宜本草的补水类商品以及妮维雅的清洁类商品,这两类销量很接近。而销售额上,相宜本草的补水类商品比妮维雅的清洁类商品要高得多,这显然是商品平均单价不同所导致的。由于不同的类别使用量也不同,销量自然也会有所区别,所以相对于比较每个店铺的不同类别的销售量,比较每个不同类别的各店铺的销售量应该更有价值。


性别偏好分析
男士专用产品
男士专用产品的销售量和销售额分别占总销售量和总销售额的18.16%和10%。
男士专用产品主要集中在护肤品,尤其是妮维雅和欧莱雅。


与之前的饼图相比,能发现什么?
男士的销量基本来自于清洁类,其次是补水类。而这两类正是总销量中占比最高的两类。
非男士专用中,补水类成为了销量最高的类别,清洁类降到了第二位。
男士专用的销量以及销售额占比都比较低。
显然,在没有区分性别的情况下,由于清洁类是男性女性通用,所以占得销量最高是理所应当的。而非男士专用中,女性消费者较多,所以补水类一跃成为最高销量。
尽管就整个销量而言,男士专用的占比不高,但是这也说明男性市场是一个值得发展急需拓宽的点。如果增加更多关于男性护肤品的推广,有可能会吸引更多的男性消费者从而增加销量。所以进一步分析,各个店铺的男性专用商品的销量。

男士专用护肤品的销售量前三名分别是:妮维雅,欧莱雅,相宜本草。所有男士商品主要销量来自于护肤品。对于其他类这里暂时不进行分析,因为其产生大概率是basic_data也就是我们的分类集不完善导致的。观察一下男用化妆品的数据,如下:

可以看出基本都是男用唇膏。因为将唇膏归于了口红类,而口红类归于了化妆品类。
接下来看看各个店铺的男士专用商品的总销量销售额是怎样的 :


女士专用产品
从前面数据看出来,女士产品的销售量和销售额分布较为均衡,主要集中在相宜本草、美宝莲、悦诗风吟和欧莱雅。跟男士不一样。
时间序列分析
销售量与销售额的时间变化
观察两个折线图,其走势是相同的,因为整个销量与销售额应该是成正相关的。
图形有如下特点:
在9日单日销售量达到峰值,而在11日达到最小
10日之前的波动趋势相对稳定,在11日有一个急剧的下降
11日过后又开始缓慢的增长。由于统计的日期有限,无法判断这种趋势是长期的还是短期的。
++建议商家在销售量高峰前几天安排促销活动,以最大化销售额。++


数据分析项目的四个步骤:
数据采集:可以通过爬虫或使用开源数据集。
数据探索:使用numpy和panda进行初步的数据了解和处理。
数据预处理:处理重复值、缺失值和异常值。
数据可视化 :根据预处理后的数据进行++图表绘制和分析++(可视化)
数据分析的重要性和实际应用
通过数据分析和可视化可以发现潜在的商业机会和消费者偏好。
数据分析结果,建议商家优化产品组合和促销策略,以提高销售额和客户满意度。