【数据可视化-28】2017-2025 年每月产品零售价数据可视化分析

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者,提供AI相关的技术咨询、项目开发和个性化解决方案等服务,如有需要请站内私信或者联系任意文章底部的的VX名片(ID:xf982831907
💬 博主粉丝群介绍:① 群内初中生、高中生、本科生、研究生、博士生遍布,可互相学习,交流困惑。② 热榜top10的常客也在群里,也有数不清的万粉大佬,可以交流写作技巧,上榜经验,涨粉秘籍。③ 群内也有职场精英,大厂大佬,可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份,助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本,送真活跃粉丝,助你提升文章热度。有兴趣的加文末联系方式,备注自己的CSDN昵称,拉你进群,互相学习共同进步。

【数据可视化-28】2017-2025 年每月产品零售价数据可视化分析

    • 一、引言
    • 二、数据探索
      • [2.1 数据集介绍](#2.1 数据集介绍)
      • [2.2 数据清洗与探索](#2.2 数据清洗与探索)
    • 三、可视化
      • [3.1 各地区价格分布](#3.1 各地区价格分布)
      • [3.2 产品类别价格分布](#3.2 产品类别价格分布)
      • [3.3 年度价格变化趋势](#3.3 年度价格变化趋势)
      • [3.4 必需品与非必需品价格分布](#3.4 必需品与非必需品价格分布)
      • [3.5 价格与税率的关系](#3.5 价格与税率的关系)
      • [3.6 地区、产品类别与价格的关系](#3.6 地区、产品类别与价格的关系)
      • [3.7 税收政策与价格的关系](#3.7 税收政策与价格的关系)
      • [3.8 年份、地区与价格的关系](#3.8 年份、地区与价格的关系)
      • [3.9 产品类别、年份与价格的关系](#3.9 产品类别、年份与价格的关系)
      • [3.10 必需品、地区与价格的关系](#3.10 必需品、地区与价格的关系)
    • 四、总结与洞察

一、引言

消费品价格数据的可视化分析,对于理解市场动态、制定经济政策以及优化家庭预算规划具有重要意义。本文将基于涵盖不同地区、产品类别和时间维度的价格数据集,从多个角度进行可视化探索,帮助大家更直观地把握全球消费品价格的分布特征与演变趋势。

二、数据探索

2.1 数据集介绍

本数据集包含以下变量:

  • Year:参考年份
  • Month:参考月份
  • GEO:地理区域(编码为Province 1、Province 2等)
  • Products:零售产品的名称
  • COORDINATE:产品内部坐标标识符
  • VALUE:每单位产品的原始价格(税前)
  • UOM:计量单位(例如,美元)
  • Taxable:产品是否应税,'Yes'为是,'No'为否
  • Total tax rate:基于省份或加拿大平均的总税率(%)
  • Value after tax:应税产品含税价格,不应税产品则与VALUE相同
  • Product Category:产品的高级别分类
  • Essential:产品属于基本需求还是非基本需求

2.2 数据清洗与探索

python 复制代码
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 加载数据
df = pd.read_csv('product_retail_prices.csv')  # 请替换为实际文件路径

# 查看数据基本信息
print(df.info())
print(df.describe())

# 查看各列唯一值数量
print(df.nunique())

从数据的基本信息中,我们可以发现:

  • 数据集包含多个类别型变量(如GEO、Product Category等)和数值型变量(如VALUE、Total tax rate等)
  • 一共有118482条数据,并且数据中无缺失值的存在。

三、可视化

3.1 各地区价格分布

python 复制代码
plt.figure(figsize=(15, 8))
sns.boxplot(x='GEO', y='VALUE', data=df)
plt.title('Price Distribution Across Regions')
plt.xlabel('Region')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

观察结果:不同地区的消费品价格存在显著差异,经济发达地区的价格普遍高于经济欠发达地区。

3.2 产品类别价格分布

python 复制代码
plt.figure(figsize=(15, 8))
sns.boxplot(x='Product Category', y='VALUE', data=df)
plt.title('Price Distribution Across Product Categories')
plt.xlabel('Product Category')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

观察结果:不同产品类别的价格差异明显,电子产品和家电价格普遍较高,而食品和日用品价格相对较低。

3.3 年度价格变化趋势

python 复制代码
plt.figure(figsize=(12, 6))
sns.lineplot(x='Year', y='VALUE', data=df, ci=None)
plt.title('Annual Price Trend')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.tight_layout()
plt.show()

观察结果:消费品价格呈现逐年上升趋势,反映出通货膨胀的影响。

3.4 必需品与非必需品价格分布

python 复制代码
plt.figure(figsize=(12, 6))
sns.boxplot(x='Essential', y='VALUE', data=df)
plt.title('Price Distribution of Essential vs Non-Essential Products')
plt.xlabel('Product Type')
plt.ylabel('Price')
plt.tight_layout()
plt.show()

观察结果:必需品价格相对稳定且集中在较低水平,而非必需品价格波动较大且部分产品价格较高。

3.5 价格与税率的关系

python 复制代码
plt.figure(figsize=(12, 8))
sns.scatterplot(x='Total tax rate', y='VALUE', data=df, alpha=0.6, color='purple')
plt.title('Relationship Between Tax Rate and Price')
plt.xlabel('Tax Rate (%)')
plt.ylabel('Price')
plt.tight_layout()
plt.show()

观察结果:价格与税率存在一定的正相关关系,高税率地区往往伴随着较高的消费品价格。

3.6 地区、产品类别与价格的关系

python 复制代码
plt.figure(figsize=(18, 10))
sns.boxplot(x='GEO', y='VALUE', hue='Product Category', data=df)
plt.title('Price Variation by Region and Product Category')
plt.xlabel('Region')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()

观察结果:不同地区和产品类别的价格差异显著,例如电子产品在某些发达国家地区价格最高,而在发展中国家地区价格相对较低。

3.7 税收政策与价格的关系

python 复制代码
plt.figure(figsize=(12, 8))
sns.boxplot(x='Taxable', y='VALUE', data=df)
plt.title('Price Variation by Taxable Status')
plt.xlabel('Taxable Status')
plt.ylabel('Price')
plt.tight_layout()
plt.show()

观察结果:应税产品的价格普遍高于不应税产品,税收对价格有显著影响。

3.8 年份、地区与价格的关系

python 复制代码
plt.figure(figsize=(18, 10))
sns.lineplot(x='Year', y='VALUE', hue='GEO', data=df)
plt.title('Price Trend Over Years by Region')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()

观察结果:各地区的价格增长趋势存在差异,发达国家地区的增长相对平稳,而部分发展中国家地区的价格增长较快。

3.9 产品类别、年份与价格的关系

python 复制代码
plt.figure(figsize=(18, 10))
sns.lineplot(x='Year', y='VALUE', hue='Product Category', data=df)
plt.title('Price Trend Over Years by Product Category')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()

观察结果:不同产品类别的价格增长趋势不同,电子产品价格增长较快,而食品价格相对稳定。

3.10 必需品、地区与价格的关系

python 复制代码
plt.figure(figsize=(18, 10))
sns.boxplot(x='Essential', y='VALUE', hue='GEO', data=df)
plt.title('Price Variation of Essential Products by Region')
plt.xlabel('Product Type')
plt.ylabel('Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()

观察结果:不同地区的必需品价格差异显著,部分地区的必需品价格较高,可能影响当地居民的生活成本。

四、总结与洞察

通过以上多维度的可视化分析,我们得出以下关键洞察:

  1. 地区价格差异显著:经济发达地区的价格普遍高于经济欠发达地区,反映经济发展水平对价格的影响。

  2. 产品类别价格差异明显:电子产品和家电价格较高,而食品和日用品价格相对较低,与产品附加值和市场需求相关。

  3. 必需品价格相对稳定:必需品价格集中在较低水平且波动较小,而非必需品价格波动较大,部分产品价格较高。

  4. 税收对价格影响显著:应税产品的价格普遍高于不应税产品,税率与价格存在正相关关系。

  5. 地区价格增长趋势差异:发达国家地区的增长相对平稳,而部分发展中国家地区的价格增长较快,可能受多种经济因素影响。

以上分析为理解全球消费品价格的分布特征与演变趋势提供了多维度视角,揭示了各变量之间的潜在关系,为进一步的经济研究和政策制定提供了数据支持。


相关推荐
lilye6620 分钟前
精益数据分析(20/126):解析经典数据分析框架,助力创业增长
大数据·人工智能·数据分析
小墙程序员1 小时前
机器学习入门(二)线性回归
机器学习
橘猫云计算机设计1 小时前
springboot基于hadoop的酷狗音乐爬虫大数据分析可视化系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·hadoop·spring boot·爬虫·python·数据分析·毕业设计
追逐☞2 小时前
机器学习(7)——K均值聚类
机器学习·均值算法·聚类
追逐☞3 小时前
机器学习(9)——随机森林
人工智能·随机森林·机器学习
硅谷秋水5 小时前
CoT-Drive:利用 LLM 和思维链提示实现自动驾驶的高效运动预测
人工智能·机器学习·语言模型·自动驾驶
IT古董5 小时前
【漫话机器学习系列】214.停用词(Stop Words)
人工智能·机器学习
Guheyunyi6 小时前
智能照明系统:照亮智慧生活的多重价值
大数据·前端·人工智能·物联网·信息可视化·生活
用户199701080186 小时前
深入解析淘宝商品详情 API 接口:功能、使用与实践指南
大数据·爬虫·数据挖掘