【京东电商API接口】 | 京东某商品销量数据分析可视化

Python当打之年

当打之年,专注于各领域Python技术,量的积累,质的飞跃。后台回复:【可视化项目源码】可获取可视化系列文章源码和数据

本期将利用Python分析「京东商品数据接口」,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

Pandas --- 数据处理

Pyecharts --- 数据可视化

  1. 导入模块

    import jieba
    import pandas as pd
    from pyecharts.charts import Line
    from pyecharts.charts import Bar
    from pyecharts.charts import Pie
    from pyecharts.charts import Map
    from pyecharts.charts import WordCloud
    from pyecharts import options as opts
    import warnings
    warnings.filterwarnings('ignore')

  2. Pandas数据处理

2.1 读取数据

复制代码
df = pd.read_excel("./销量数据.xlsx")

2.2 查看数据信息

复制代码
df.info()

2.3 查看数据描述信息

复制代码
df.describe()
  1. Pyecharts数据可视化

3.1 销量(瓶)地图分布

复制代码
def map1():
    map1 = (
        Map()
        .add('',
             data,
             'china',
             is_map_symbol_show=False,
             label_opts=opts.LabelOpts(is_show=False)
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='1-销量(瓶)地图分布',
                subtitle=subtitle,
                pos_top='1%',
                pos_left="1%"
            ),
            legend_opts=opts.LegendOpts(is_show=False),
            visualmap_opts=opts.VisualMapOpts(
                pos_bottom='10%',
                pos_left='20%'
            ),

        )
    )
  • 云南、贵州、河北、广东、四川等地销量比较高。

3.2 每月销量(瓶)

复制代码
def bar():
    bar = (
        Bar()
           .add_xaxis(x_data)
           .add_yaxis('', y_data, category_gap='30%')
           .set_global_opts(
                title_opts=opts.TitleOpts(
                    title='2-每月销量(瓶)',
                    subtitle=subtitle,
                    pos_top='1%',
                    pos_left="1%"
                ),
                visualmap_opts=opts.VisualMapOpts(
                    is_show=False,
                ),
                legend_opts=opts.LegendOpts(is_show=False),
           )
    )

3.3 男性女性购买数量占比

3.4 产品品种销量

复制代码
def pie1():
    pie1 = (
        Pie()
        .add(
            "",
            [list(z) for z in zip(x_data, y_data)],
            radius=["40%", "70%"],
            center=["50%", "50%"],
        )
        .set_colors(['#D32F2F','#1864ab','#FFCA28','#616161'])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='4-产品品种销量',
                subtitle=subtitle,
                pos_top='1%',
                pos_left="1%"
            ),
            legend_opts=opts.LegendOpts(is_show=False)
        )
    )
  • 红色包装 销量最高,占比达到约40% ,其次是金色包装 ,占比约24%

3.5 消费者年龄段销量

  • 从上榜电影类型分布上看,老年、中年、青年占比基本持平。

3.6 男性女性每月购买数量

3.7 销量前15的城市

复制代码
def bar1():
    bar = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right'))
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='7-销量前15的城市',
                subtitle=subtitle,
                pos_top='1%',
                pos_left="1%",
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
            ),
            legend_opts=opts.LegendOpts(is_show=False),
        )
        .reversal_axis()
    )
  • 石家庄市 以762的销量排名第一,是排名第二昆明市、北京市的2.5倍左右。

3.8 评论词云

3.9 每月各地区销售额度

相关推荐
好奇的菜鸟22 分钟前
如何在IntelliJ IDEA中设置数据库连接全局共享
java·数据库·intellij-idea
tan180°23 分钟前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
大千AI助手1 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配
浪裡遊1 小时前
React Hooks全面解析:从基础到高级的实用指南
开发语言·前端·javascript·react.js·node.js·ecmascript·php
Hello.Reader2 小时前
Redis 延迟排查与优化全攻略
数据库·redis·缓存
烛阴2 小时前
简单入门Python装饰器
前端·python
要努力啊啊啊2 小时前
YOLOv3-SPP Auto-Anchor 聚类调试指南!
人工智能·深度学习·yolo·目标检测·目标跟踪·数据挖掘
好开心啊没烦恼2 小时前
Python 数据分析:numpy,说人话,说说数组维度。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy
生态遥感监测笔记3 小时前
GEE利用已有土地利用数据选取样本点并进行分类
人工智能·算法·机器学习·分类·数据挖掘
面朝大海,春不暖,花不开3 小时前
使用 Python 实现 ETL 流程:从文本文件提取到数据处理的全面指南
python·etl·原型模式