Python数据分析-宝马全球汽车销售数据分析(可视化分析)

一、研究背景

在全球汽车产业结构调整与消费升级的双重驱动下,豪华汽车品牌的定价策略、市场布局及产品结构优化成为行业关注的核心议题。宝马作为全球领先的豪华汽车制造商,其销售数据不仅反映自身经营策略的有效性,更能折射出豪华车市场的消费趋势、区域特征及新能源转型进程。

本研究基于 2018-2025 年宝马全球月度销售数据集(3072 条记录),涵盖欧洲、中国、美国、世界其他地区 4 大核心市场,以及 3 系、5 系、X3、X5、X7、i4、iX、MINI 8 款主力车型,涉及销量、均价、营收、纯电动占比(BEV)、高端市场份额等 11 项核心指标。通过对该数据集的系统性分析,能够精准刻画宝马定价逻辑、市场特征及新能源转型节奏,为豪华车行业研究提供实证参考。

二、研究意义

  1. 行业参考价值:本研究通过拆解宝马全球定价策略、区域市场特征及新能源转型趋势,为豪华汽车品牌的全球化运营、产品定价及新能源布局提供可落地的参考依据,尤其对理解豪华车 "全球统一定价""车型主导定价" 等核心逻辑具有现实意义。
  2. 数据应用价值:基于 8 年完整月度数据的多维度分析,验证了车型、时间、区域、新能源占比等因素对豪华车价格的影响程度,为汽车行业数据分析提供标准化的分析框架(基础统计→分布分析→趋势分析→相关性分析→交叉分析)。
  3. 商业决策价值:明确宝马各车型价格梯队、新能源转型节奏及区域市场特征,可为车企产品规划、定价调整、市场资源分配提供数据支撑,也为消费者理解豪华车价格波动规律提供参考。

三、实证分析

完整代码和数据集(带分析)

1. 基础数据特征

python 复制代码
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

plt.style.use('dark_background')
sns.set_palette("husl")

df = pd.read_csv('bmw_global_sales_2018_2025.csv')
print(df.shape)
print(df.head())

数据集包含3072条记录,覆盖4个地区、8款车型,共11个特征。

数据集无缺失值,核心指标 "平均售价(Avg_Price_EUR)" 偏度约 0.37,接近正态分布,数据质量良好,无需进行数据转换即可直接用于分析。均价均值约 6.39 万欧元,最小值 4.00 万欧元(MINI),最大值 9.40 万欧元(X7),价格跨度显著。

2. 价格分布与车型特征

python 复制代码
fig, ax = plt.subplots(figsize=(10, 5))
ax.hist(df['Avg_Price_EUR'], bins=30, color='#c8a84b', edgecolor='black', alpha=0.85)
ax.set_title('平均售价(欧元)分布', fontsize=14)  # 中文标题
ax.set_xlabel('价格(欧元)')                      # 中文X轴标签
ax.set_ylabel('频次')                              # 中文Y轴标签
plt.tight_layout()
plt.show()

平均价格的直方图。分布呈轻微右偏,可见两个明显聚类------经济型车型(MINI、3系)和高端/SUV车型(X5、X7、iX)

各型号价格箱线图

按中位数排序的各型号价格分布。每个型号占据独特价格区间,重叠极小------验证型号是价格预测的核心特征。

各车型平均价格

python 复制代码
# 创建画布和坐标轴,设置尺寸
fig, ax = plt.subplots(figsize=(12, 6),dpi=200)

# 向量化绘图优于手动循环(中文注释)
year_model.plot(kind='line', marker='o', linewidth=2, ax=ax)

# 设置图表文字(全部改为中文)
ax.set_title('各车型价格随时间变化趋势', fontsize=14, pad=15)  # 中文标题,补充内边距更美观
ax.set_xlabel('年份', fontsize=12)                          # X轴标签:Year → 年份
ax.set_ylabel('价格 (欧元)', fontsize=12)                   # Y轴标签:Price (EUR) → 价格 (欧元)
ax.legend(title='车型', loc='upper left', fontsize=9)       # 图例标题:Model → 车型

# 保留网格样式,提升可读性
plt.grid(True, linestyle='--', alpha=0.6)
plt.tight_layout()  # 自动调整布局,防止文字截断
plt.show()

X7 车型均价最高(约 9.2 万欧元),MINI 车型最为实惠(约 4.2 万欧元)。

3. 时间与季节性特征

BEV占比趋势

纯电动汽车(BEV)占比从2018年2%稳步增长至2025年约19%------年增长2.5%的强劲线性趋势。

尽管增长显著,BEV占比与价格几乎无相关性(r=0.001),因车型特征已涵盖电动车型定价。

相关性热力图

python 复制代码
fig, ax = plt.subplots(figsize=(8, 6),dpi=200)

# 优化后的相关性热力图(便于统计审核)
sns.heatmap(
    correlation_matrix,
    annot=True,
    fmt='.3f',
    cmap='RdYlGn',
    center=0,
    linewidths=0.5,
    ax=ax,
    annot_kws={'size': 9}
)

ax.set_title('特征相关性矩阵', fontsize=14, pad=15)  # 中文标题
plt.tight_layout()
plt.show()

相关性维度:销量、GDP 增速、燃油价格指数等数值特征与价格相关性均极低(最大 r=0.039);BEV 占比与燃油价格指数相关系数高达 0.952,存在严重多重共线性,需在建模时剔除。

年度维度:纯电动汽车(BEV)占比从 2018 年 2% 稳步增长至 2025 年约 19%,年增长 2.5%,新能源转型趋势显著,但 BEV 占比与价格相关性极低(r=0.001),因电动车型定价已纳入车型特征体系。

python 复制代码
fig, ax = plt.subplots(figsize=(10, 4),dpi=200)
ax.bar(month_names, month_avg.values, color='#c84b7f', alpha=0.85, edgecolor='white', linewidth=0.5)
ax.set_ylim(month_avg.min() - 500, month_avg.max() + 500)

ax.set_title('月度均价(季节性分析)', fontsize=14, pad=15)  # 中文标题
ax.set_ylabel('价格 (欧元)', fontsize=12)                   # 中文Y轴标签

plt.tight_layout()
plt.show()

月度维度:全年月度均价仅波动约 260 欧元,无显著季节性特征,表明时间因素对宝马定价影响极小。

4. 区域与相关性特征

车型×地区价格热力图

python 复制代码
fig, ax = plt.subplots(figsize=(10, 6),dpi=200)
sns.heatmap(pivot, annot=True, fmt='.0f', cmap='YlOrRd', ax=ax)

ax.set_title('各车型×地区均价热力图(欧元)', fontsize=14, pad=15)  # 中文标题
plt.tight_layout()
plt.show()

区域维度:中国、欧洲、美国、其他地区的同车型价格差异仅 70-200 欧元,宝马采用全球统一定价策略,区域对定价几乎无影响。

四、结论

  1. 定价核心逻辑:车型是决定宝马产品价格的主导因素,区域、时间(年度 / 月度)、宏观经济(GDP 增速)、燃油价格等因素对价格影响极小,宝马长期维持 "车型主导、全球统一定价、价格梯队稳定" 的定价策略。
  2. 市场布局特征:宝马全球市场定价趋同,无区域差异化定价策略,反映其全球化品牌运营的一致性;月度无价格季节性波动,进一步印证定价策略的稳定性。
  3. 新能源转型特征:BEV 占比呈线性增长趋势,新能源转型成效显著,但电动化进程未对产品定价产生显著影响,电动车型(i4、iX)已形成独立且稳定的价格梯队。
  4. 数据应用启示:在豪华车价格分析及建模中,可优先聚焦车型特征,剔除区域、月度、BEV 占比(因多重共线性)等非核心特征,以提升分析效率和模型准确性;同时需关注早期新能源数据的采集异常问题,保障数据质量。

创造不易,谢谢各位多多点赞收藏!

相关推荐
ARM+FPGA+AI工业主板定制专家2 小时前
基于ARM+FPGA+AI的船舶状态智能监测系统(一)总体设计
网络·arm开发·人工智能·机器学习·fpga开发·自动驾驶
前端摸鱼匠2 小时前
面试题7:Encoder-only、Decoder-only、Encoder-Decoder三种架构的差异与适用场景?
人工智能·深度学习·ai·面试·职场和发展·架构·transformer
ryrhhhh2 小时前
矩阵跃动技术创新:GEO搜索占位+AI智能体双融合,重构企业获客链路
大数据·人工智能
no_work2 小时前
基于python的hog+svm实现混凝土裂缝目标检测
人工智能·python·目标检测·计算机视觉
小陈工2 小时前
2026年3月21日技术资讯洞察:云原生理性回归与Python异步革命
人工智能·python·云原生·数据挖掘·回归
taxunjishu2 小时前
Profinet转MODBUS TCP汽车零部件工业自动化柔性产线方案
网络·自动化·汽车
柯儿的天空2 小时前
【OpenClaw 全面解析:从零到精通】第 018 篇:OpenClaw 多智能体协作系统——多 Agent 路由、任务委托与负载均衡
运维·人工智能·aigc·负载均衡·ai编程·ai写作·agi
2301_766558652 小时前
矩阵跃动OpenClaw龙虾机器人:本地AI智能体+GEO优化,企业流量自动化落地
人工智能·矩阵·机器人
LONGZETECH2 小时前
职业院校新能源汽车专业仿真教学软件建设指南
架构·汽车·汽车仿真教学软件·汽车教学软件·新能源汽车仿真教学软件