【59 Pandas+Pyecharts | 淘宝华为手机商品数据分析可视化】

文章目录

  • [🏳️‍🌈 1. 导入模块](#🏳️‍🌈 1. 导入模块)
  • [🏳️‍🌈 2. Pandas数据处理](#🏳️‍🌈 2. Pandas数据处理)
    • [2.1 读取数据](#2.1 读取数据)
    • [2.2 数据信息](#2.2 数据信息)
    • [2.3 数据去重](#2.3 数据去重)
    • [2.4 提取付款人数](#2.4 提取付款人数)
    • [2.5 计算销量](#2.5 计算销量)
    • [2.6 发货地址处理](#2.6 发货地址处理)
  • [🏳️‍🌈 3. Pyecharts数据可视化](#🏳️‍🌈 3. Pyecharts数据可视化)
    • [3.1 各系列手机销售占比](#3.1 各系列手机销售占比)
    • [3.2 各价格区间手机销量](#3.2 各价格区间手机销量)
    • [3.3 各省手机发货量地图](#3.3 各省手机发货量地图)
    • [3.4 手机发货量TOP10城市](#3.4 手机发货量TOP10城市)
    • [3.5 店铺累计手机销售额TOP10](#3.5 店铺累计手机销售额TOP10)
    • [3.6 旗舰店手机销量占比](#3.6 旗舰店手机销量占比)
    • [3.7 商品标题词云](#3.7 商品标题词云)
  • [🏳️‍🌈 4. 可视化项目源码+数据](#🏳️‍🌈 4. 可视化项目源码+数据)

大家好,我是 👉 【Python当打之年(点击跳转)】

本期将利用Python分析「华为手机数据集」 ,看看:各系列手机销售占比、各价格区间手机销量分布、各省手机发货量地图、手机发货量TOP10城市、店铺累计手机销售额TOP10、旗舰店手机销量占比等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas --- 数据处理
  • Pyecharts --- 数据可视化

🏳️‍🌈 1. 导入模块

python 复制代码
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

python 复制代码
df = pd.read_excel('./华为手机.xlsx')

2.2 数据信息

python 复制代码
df.info()

2.3 数据去重

python 复制代码
df = df.drop_duplicates()

2.4 提取付款人数

python 复制代码
df1['付款人数'] = df1['付款人数'].fillna('0人付款')
df1 = df1[df1['付款人数'].str.contains('付款')]
df1['num'] = [re.findall(r'\d+', i)[0] for i in df1['付款人数']]

2.5 计算销量

python 复制代码
df1['销售额'] = df1['num'] * df1['价格']
df1['销售额'] = df1['销售额'].astype('int')

2.6 发货地址处理

python 复制代码
df1['省份'] = df1['发货地址'].str.split(' ').apply(lambda x:x[0])
df1['城市'] = df1['发货地址'].str.split(' ').apply(lambda x:x[1])

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各系列手机销售占比

python 复制代码
def get_pie():
    pie1 = (
        Pie()
        .add('',
             datas,
             center=['50%', '55%'],
            )
        .set_global_opts(
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            ),
            title_opts=opts.TitleOpts(
                title='1-华为各系列手机销售占比',
                subtitle=subtitle,
                pos_top='2%',
                pos_left="center",
            )
        )
    )
  • Mate(53.79%)、 Pura(16.78%)、Nova(7.05%)、畅享(22.38%)

3.2 各价格区间手机销量

python 复制代码
def get_line():
    line = (
        Line()
        .add_xaxis(x_data)
        .add_yaxis('', y_data)
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='2-各价格区间手机销量',
                subtitle=subtitle,
                pos_top='2%',
                pos_left="center",
            ),
        )
    )
  • 1000-2000元区间手机购买人数最多,超过30万人付款,其次是2000-3000元区间,付款人数也超过了20万,1000-3000元区间销量占比超过了60%

3.3 各省手机发货量地图

  • 上图可以看出:发货地主要集中在广东、江苏、浙江、上海、山东、北京、河北等地

3.4 手机发货量TOP10城市

python 复制代码
def get_bar():
    chart = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right'))
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='4-手机发货量TOP10城市',
                subtitle=subtitle,
                pos_top='2%',
                pos_left='center',
                ),
        )
    )
  • 深圳(401397)、东莞(151210)、北京(69626)、杭州(45744)、广州(32577)、上海(24253)、唐山(13116)、济南(13112)、揭阳(6450)、宁波(6017)

3.5 店铺累计手机销售额TOP10

  • 华为官方旗舰店(101740万)、苏宁易购官方旗舰店(15698万)、喵速达电器官方旗舰店(6274万)、华为蓝阳专卖店(5697万)、信息港数码专营店(4843万)

3.6 旗舰店手机销量占比

  • 旗舰店手机销量占比:61.62%

3.7 商品标题词云

python 复制代码
def get_wordcloud():
    wordcloud = (
        WordCloud()
        .add("",data_pair=datas, word_size_range=[20, 80])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='7-商品标题词云',
                subtitle=subtitle,
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color=lab_color, font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            ),
        )
    )

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏 也可以分享注明出处)让更多人知道。

相关推荐
cz追天之路1 小时前
华为机考 ------ 识别有效的IP地址和掩码并进行分类统计
javascript·华为·typescript·node.js·ecmascript·less·css3
航Hang*2 小时前
第五章:网络系统建设与运维(中级)——生成树协议
运维·服务器·网络·笔记·华为·ensp
liu****4 小时前
02_Pandas_数据结构
数据结构·python·pandas·python基础
生信碱移4 小时前
单细胞空转CNV分析工具:比 inferCNV 快10倍?!兼容单细胞与空转的 CNV 分析与聚类,竟然还支持肿瘤的亚克隆树构建!
算法·机器学习·数据挖掘·数据分析·聚类
RFCEO4 小时前
用手机写 Python程序解决方案
开发语言·python·智能手机·qpython环境安装
Brduino脑机接口技术答疑4 小时前
TDCA 算法在 SSVEP 场景中:Padding 的应用对象与工程实践指南
人工智能·python·算法·数据分析·脑机接口·eeg
深眸财经7 小时前
智能手机的2025:厮杀、阵痛与价值重塑
智能手机
航Hang*7 小时前
第三章:网络系统建设与运维(中级)——交换技术
运维·笔记·计算机网络·华为·ensp·交换机
l134062082357 小时前
Flutter Geocoding 在鸿蒙上的使用指南
flutter·华为·harmonyos
无人装备硬件开发爱好者7 小时前
华为海思 BS21E (H2821E) 星闪组网测距定位 技术可行性方案
华为·最小二乘法·星闪·测距定位