【数据分析实战】24年T4某二手车交易平台数据分析

文章目录

引言

二手车市场近年来发展迅猛,成为新车市场的重要补充,同时也是消费者和商家关注的重点领域。本报告基于某知名二手车平台的数据进行系统分析,深入分析二手车市场的规律和潜在机会。本文将基于具体样本数据,通过对价格、折旧率、品牌构成、地域分布以及车龄对价格的影响等多个维度的深入分析,揭示市场背后的趋势,为消费者和平台提供数据驱动的决策参考。

数据概述与处理

数据特征介绍

本次分析使用的数据来自某大型二手车交易平台,数据涵盖了全国范围内第四季度363089 条二手车源,包括车况、品牌、价格、车龄、公里数、挂牌城市等多个维度。我们对数据进行了严格的清洗和预处理,确保分析结果的准确性。

  • 车辆基本信息:品牌、车型、排量、变速箱类型等。
  • 市场交易信息:价格、挂牌城市、过户次数、挂牌及更新日期等。
  • 附加特征:新车指导价、车龄、公里数、环保标准等。

数据预处理

为了确保分析结果的准确性,数据需要进行以下处理:

  1. 字段格式标准化:统一价格、日期等字段的格式。
  2. 缺失值处理:针对缺失值进行合理填充或剔除。
  3. 特征衍生:计算折车龄等衍生特征,以便进一步分析。
python 复制代码
import pandas as pd

# 样本数据加载
data = [
    {
        "car_brand": "大众", "car_models": "甲壳虫", "car_price": 5.98, 
        "newcar_price": 32.0, "license_date": "200609", "road_haul": "10万公里",
        "city": "sh", "district_name": "上海", 
        "createtime": "2024-11-05T09:20:04.776Z", "updatetime": "2024-11-15T10:53:08.030Z"
    }
]
df = pd.DataFrame(data)

# 处理价格
df['car_price_int'] = df.car_price.apply(convert_to_number)
df['newcar_price_int'] = df.newcar_price.apply(convert_to_number)

# 数据处理
df['car_age'] = 2024 - df['license_date'].astype(str).str[:4].astype(int)
df['createtime'] = pd.to_datetime(df['createtime'])
df['updatetime'] = pd.to_datetime(df['updatetime'])

数据分析

1. 价格与折旧率分析

折旧率分析

折旧率是二手车价格变化的重要指标,它反映了车辆在使用过程中的价值贬值。通常情况下,车龄越长,折旧率越高。以下是通过计算折旧率的结果:

折旧率较低的二手车保值性更强。

计算折旧率
py 复制代码
# 1. 计算每个品牌出现的次数
brand_counts = df['car_brand'].value_counts()
# 2. 过滤出出现次数超过10次的品牌
valid_brands = brand_counts[brand_counts > 500].index
# 3. 过滤数据,只保留这些品牌的数据
filtered_df = df[df['car_brand'].isin(valid_brands)]
# 4. 计算这些品牌的平均折旧率,并按折旧率升序排列,取前10个品牌
brand_depreciation = (
    filtered_df.groupby('car_brand')['depreciation_rate']
    .mean()
    .reset_index()
    .sort_values(by='depreciation_rate', ascending=True)
    .head(15)
)
ID 车品牌 平均折旧率
24 坦克 0.38036
54 理想汽车 0.433246
76 鸿蒙智行 0.522873
73 领克 0.555475
35 广汽传祺 0.586675
14 保时捷 0.587398
68 长安欧尚 0.592723
57 红旗 0.593319
17 北京 0.599873
30 奔驰 0.611345
4 上汽大通MAXUS 0.612841
72 雷克萨斯 0.629306
47 江铃 0.634343
42 林肯 0.634882
40 本田 0.639231
可视化

通过柱状图展示不同品牌的平均折旧率:

python 复制代码
# 创建 pyecharts 图表
bar = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK, bg_color='rgb(18, 39, 82)'))
    .add_xaxis(brand_depreciation['car_brand'].tolist())  
    .add_yaxis('平均折旧率', brand_depreciation['depreciation_rate'].tolist(), label_opts=opts.LabelOpts(is_show=False))  
    .set_global_opts(
        title_opts=opts.TitleOpts(title="不同品牌的平均折旧率", subtitle='二手车24T4'),
        xaxis_opts=opts.AxisOpts(
            name="品牌",            
            axislabel_opts=opts.LabelOpts(rotate=25) 
        ),
        yaxis_opts=opts.AxisOpts(name="折旧率"),
        toolbox_opts=opts.ToolboxOpts()
    )
)
bar.render_notebook()  

洞察

  • 高保值性品牌(低折旧率)

    • 坦克理想汽车鸿蒙智行 等品牌在消费者中受到的青睐较大,或因市场需求持续增长,或因其技术和品牌影响力较强。这些品牌的车主较少出现快速出售的情况,因此二手车价格的折旧速度较慢。
  • 品牌与市场需求

    • 豪华车 (如奔驰雷克萨斯保时捷)的折旧率普遍较高,但仍处于一个较低的区间。豪华车的市场有高购买力消费者,但过高的市场供给和换车频率会导致它们的二手车价格大幅下滑。
  • 车型差异化

    • 新兴的电动汽车 (如理想汽车 )和智能科技车型 (如鸿蒙智行)的低折旧率,意味着它们能够更好地适应市场的需求变化,尤其是在消费者对新技术的追求和品牌认同度上,它们表现出较强的市场竞争力。

2. 品牌构成分析

品牌分布

品牌是影响二手车价格的重要因素之一。通过对二手车品牌的分布进行分析,可以揭示出市场的品牌偏好。

可视化
python 复制代码
# 计算品牌出现的频次
brand_counts = df['car_brand'].value_counts()
bar = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK, bg_color='rgb(18, 39, 82)'))
    .add_xaxis(brand_counts.index.tolist()[:15])  # 品牌名称
    .add_yaxis('品牌频次', brand_counts.tolist()[:15], label_opts=opts.LabelOpts(is_show=False))  # 品牌出现频次
    .set_global_opts(
        title_opts=opts.TitleOpts(title="品牌频次TOP15", subtitle='二手车24T4'),
        xaxis_opts=opts.AxisOpts(
            name="品牌",
            axislabel_opts=opts.LabelOpts(rotate=25)  # 设置x轴标签倾斜60度
        ),
        yaxis_opts=opts.AxisOpts(name="频次"),
        toolbox_opts=opts.ToolboxOpts(),   
    )
)
bar.render_notebook()  # 渲染图表
car_brand
大众 36817
奔驰 22919
宝马 22700
丰田 20406
本田 18578
奥迪 17417
别克 16893
日产 13673
福特 12256
现代 10095
吉利汽车 9314
比亚迪 8939
雪佛兰 7509
哈弗 7273
五菱汽车 7212

洞察

  1. 大众品牌的市场主导地位

    • 大众的36817辆市场份额在所有品牌中遥遥领先,这可能与其车型的可靠性、售价范围的广泛适应性以及较高的市场认知度密切相关。大众可能吸引了大量注重性价比和品牌可靠性的消费者,尤其是在家庭轿车和中型车市场中占有主导地位。
  2. 豪华车市场的稳定性

    • 奔驰宝马等豪华车品牌的二手车市场份额较高,体现了这些品牌在高端市场中的长期影响力和消费者的忠诚度。尽管豪华车的购车成本较高,但它们在二手市场仍有较好的保值性,吸引了不少消费者选择购入较新的二手豪华车型。
  3. 本田、丰田和奥迪的平衡性

    • 丰田本田 的市场份额也表现较好,表明这两个品牌在中低端市场中非常受欢迎。它们的车系具有高性价比和可靠性,消费者普遍认为它们的车辆更具耐用性和经济性,特别是在二手市场中,购买者对这些品牌的车辆有较高的需求。
  4. 本土品牌的逐步崛起

    • 吉利汽车比亚迪哈弗五菱汽车 等本土品牌,虽然市场份额较大众、奔驰等品牌较低,但在国内市场的份额逐年增加。尤其是比亚迪 ,随着新能源汽车的爆发式增长,其在二手车市场的份额有可能进一步增加。哈弗作为一个专注于SUV领域的品牌,凭借较高的性价比和较低的折旧率,正在逐步获取更多消费者的青睐。

3. 地域分布与市场分析

城市交易分布

二手车市场的地域分布具有明显的层级性。通常情况下,一线城市的二手车交易活跃,而二线、三线城市的需求逐渐增加。通过分析各个城市的二手车交易情况,可以发现:

可视化
python 复制代码
city_summary = pd.value_counts(df['district_name'])
# 创建 pyecharts 图表,显示前10个城市的二手车数量
bar = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK, bg_color='rgb(18, 39, 82)'))
    .add_xaxis(city_summary.head(15).index.tolist())
    .add_yaxis('二手车数量', city_summary.head(15).tolist(),  label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(
        title_opts=opts.TitleOpts(title="二手车数量城市Top15", subtitle='二手车24T4'),
        xaxis_opts=opts.AxisOpts(
            name="城市",
            axislabel_opts=opts.LabelOpts(rotate=25)  # 设置x轴标签倾斜60度
        ),
        yaxis_opts=opts.AxisOpts(name="车数量")
    )
)
bar.render_notebook() 
district_name
成都 18174
东莞 16777
宁波 13331
沈阳 12825
广州 12419
石家庄 9632
南宁 8586
深圳 8502
哈尔滨 8020
福州 7848
北京 7557
武汉 7412
重庆 6831
长沙 6796
苏州 6531

洞察

  1. 一线城市与经济中心的市场主导地位

    • 成都、东莞和广州等城市处于市场交易量的前列,显示出这些城市在中国二手车市场中的重要地位。这些城市的市场需求不仅来自于消费者个人购车需求,还与产业发展、人口密度和交通枢纽地位密切相关。二手车平台和车商可以重点关注这些市场。
  2. 二线城市的快速增长

    • 宁波、沈阳和石家庄等二线城市在交易量上也位列前十,显示出二线城市的二手车市场潜力逐渐释放。随着这些城市经济水平的提升、居民收入的增加,二手车市场的需求将继续增长,尤其是在汽车消费逐渐从一线城市向二线、三线城市扩展的趋势下。
  3. 二手车市场的地域差异

    • 北京、上海、深圳等一线城市的二手车市场竞争相对激烈,但市场规模大,消费者的购车预算普遍较高。二手车市场中的车型较为多样,从低价经济型车到高端豪华车都有涉及,价格波动较大。
    • 一些二线城市(如沈阳、南宁等)则可能呈现出较为稳定的市场需求,特别是中低端车型的需求较大。随着这些城市居民购车需求的增加,这些市场将逐渐成为二手车交易的重要阵地。

4. 车龄对价格的影响

车龄与价格的关系

车龄是二手车价格的重要决定因素之一。通常,车龄越长,价格越低。以下是车龄与价格的关系图:

可视化
python 复制代码
# 假设 df 是你的数据框,包含 'car_age', 'newcar_price', 'car_price', 'car_brand' 等字段
df['loss_amount'] = df['newcar_price_int'].astype(float) - df['car_price_int'].astype(float)  # 计算亏损金额
df['license_year'] = df['license_date'].apply(lambda x:int(str(x)[:4]))  # 提取上牌年份
current_year = datetime.datetime.now().year  # 当前年份
df['car_age'] = current_year - df['license_year']  # 计算车龄
# 提取车龄和亏损金额
car_age = df['car_age'].values
loss_amount = df['loss_amount'].values
brands = df['car_brand'].values
# 创建回归模型
model = LinearRegression()
X = car_age.reshape(-1, 1)  # 车龄数据需要二维化
model.fit(X, loss_amount)

# 预测亏损金额,生成回归线的数据
regression_line = model.predict(X)
filtered_df = df[df['car_brand'].isin(brand_counts.index.tolist()[:10])]
# 按车龄和品牌计算亏损金额
brand_age_loss = filtered_df.groupby(['car_age'])['loss_amount'].mean().reset_index()
# 创建pyecharts图表
scatter = (
    Scatter(init_opts=opts.InitOpts(theme=ThemeType.CHALK, bg_color='rgb(18, 39, 82)'))
    .add_xaxis(brand_age_loss['car_age'].astype(str).tolist())  # 车龄
    .add_yaxis(
        "亏损金额",
        brand_age_loss['loss_amount'].tolist(),
        symbol_size=6,
        label_opts=opts.LabelOpts(is_show=False),
        itemstyle_opts=opts.ItemStyleOpts(color="#3398DB"),
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="二手车数量Top10品牌车龄与亏损金额的关系"),
        xaxis_opts=opts.AxisOpts(name="车龄(年)"),
        yaxis_opts=opts.AxisOpts(name="亏损金额(元)"),
        tooltip_opts=opts.TooltipOpts(trigger="item", formatter="{b}年: {c}元"),
    )
)
# 渲染并显示
scatter.render_notebook()  

洞察

  1. 车龄0-5年:

    • 车辆的亏损金额较高,尤其是新车,折旧幅度较大。这是因为新车的市场价格波动较大,而且新车折旧主要受市场需求、品牌、车型和车辆配件等多种因素影响。
  2. 车龄6-14年:

    • 在这个阶段,亏损金额相对稳定。随着车龄增加,车辆的贬值速度放缓,亏损额趋于平稳。此时,车辆的市场价值较为固定,主要受到市场需求和维护状况的影响。
  3. 车龄15年以上:

    • 车辆的亏损金额再次增大,尤其是车龄较长(例如25年及以上)。这类车辆面临的亏损主要是由于技术更新换代、零件老化、维护费用增加等原因。随着车龄进一步增加,车辆进入报废期,亏损的幅度更为显著。

主要发现

  1. 品牌与折旧率的关系

    • 从折旧率分析中可以看出,不同品牌的二手车保值性差异明显。坦克理想汽车鸿蒙智行等品牌的平均折旧率相对较低,表明这些品牌的二手车具有更强的保值性,消费者可能会倾向于长期持有这些车,导致其市场上的二手车供应较少,价格下降较慢。
    • 相比之下,奔驰雷克萨斯保时捷等豪华品牌的折旧率较高,尽管其市场需求仍然强劲,但由于较高的市场供应量和消费者换车频繁,导致二手车价格较快下降。
    • 新兴电动汽车品牌(如理想汽车)的低折旧率表明这些品牌能够较好地适应市场需求,尤其是由于其技术先进、品牌认同感强,可能在未来几年内进一步提升其市场份额。
  2. 品牌市场分布

    • 根据品牌分布分析,大众 品牌在二手车市场中占据主导地位,36817辆的市场份额远超其他品牌。这反映了大众品牌在国内市场的高度认可,尤其是在家庭轿车和中型车市场中,消费者对其性价比和可靠性的高评价推动了其市场份额的扩大。
    • 豪华品牌如奔驰宝马的二手车交易量也相对较高,显示了这些品牌在高端市场中的持续竞争力。尽管豪华车的折旧率较高,但这些品牌仍然保持了较高的市场需求,二手市场具有相对稳定的消费群体。
    • 本土品牌的崛起,尤其是吉利汽车比亚迪哈弗等品牌的逐步扩展,表明国内消费者对这些品牌的认可度和市场需求逐渐增强,尤其在新能源汽车和SUV市场中,二手车交易量显著增长。
  3. 地域差异与市场趋势

    • 从地域分布分析来看,成都东莞广州等一线城市的二手车市场交易量排名前列,这些城市的二手车需求强劲,市场规模庞大。这些城市的高交易量不仅反映了其较高的消费能力,还与这些城市作为经济和交通中心的地位密切相关。
    • 二线城市如宁波沈阳石家庄的二手车市场也显示出较为快速的增长趋势。随着这些城市经济水平的提高及居民收入的增长,二手车市场需求逐渐从一线城市向二线、三线城市扩展,这些城市有潜力成为二手车市场的重要组成部分。
  4. 车龄对价格的影响

    • 车龄是影响二手车价格的关键因素。根据车龄与亏损金额的关系分析,随着车龄的增加,二手车的亏损金额显著上升,价格下降趋势明显。这一趋势符合消费者普遍的购买心理:车龄较大的二手车价格较低,因此二手车市场的主力消费群体往往更偏向购买车龄较低、保值性较强的车型。

写在最后

通过对二手车交易平台363089 条公开数据的深入分析,我们发现品牌、车龄以及地域差异等因素显著影响着二手车的价格和市场走势。未来,随着新能源汽车的普及和本土品牌的崛起,二手车市场可能会呈现出更加多元化的格局。而一线城市和经济中心的市场将继续占据主导地位,但二线、三线城市的快速增长也为二手车市场带来了新的增长潜力。

这些洞察为二手车平台和车商在制定市场战略时提供了有价值的参考依据,可以帮助他们更好地理解市场需求、优化车型选择和定价策略。

该分析仅供学习交流使用,禁止用于商业用途,不构成任何投资建议。

大数据分析为运营和各行业带来了前所未有的机会,使企业能够更敏锐地洞察市场、优化运营,并更有效地应对竞争和变革。在信息时代,充分利用大数据分析,将成为企业取得竞争优势的不可忽视的关键要素。
本人数据分析领域的从业者,拥有专业背景和能力,可以为您的数据挖掘和分析需求提供支持。期待着能够与您共同探索更多有意义的数据洞见,为您的项目和业务提供数据分析方面的帮助。

创作不易,如果你觉得有帮助,请点个赞支持一下。你的鼓励是我创作的最大动力,期待未来能为大家带来更多有趣的分析文章。感谢大家的阅读和支持!

2024的终点就在眼前,留住美好的记忆,迈向2025的新篇,愿你万事如意,梦想更远。

新年快乐!!!

相关推荐
MorleyOlsen4 小时前
【ChatGPT原理与应用开发】第三章:句词分类
chatgpt·分类·数据挖掘
Flerken10116 小时前
力扣【SQL连续问题】
数据库·sql·算法·leetcode·数据分析
yvestine16 小时前
数据挖掘——朴素贝叶斯分类
人工智能·算法·机器学习·分类·数据挖掘·贝叶斯分类
yvestine17 小时前
数据挖掘——模型的评价
人工智能·算法·机器学习·数据挖掘·混淆矩阵·模型评价·正确率
Easy数模17 小时前
XGBoost 分类模型优化:超参数调优与性能提升的协同攻略
人工智能·分类·数据挖掘
deardao17 小时前
【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 3:算法实现
人工智能·深度学习·神经网络·算法·分类·数据挖掘·极限标签分类
秀儿还能再秀18 小时前
数据分析思维(八):分析方法——RFM分析方法
数据分析·学习笔记·分析思维·数据素养
学计算机的睿智大学生19 小时前
关于python的数据分析与应用
开发语言·python·数据分析
泡芙萝莉酱20 小时前
中国区域创新创业指数IRIEC数据(省级、地市级)1990-2020年-社科数据
大数据·人工智能·深度学习·数据挖掘·数据分析·毕业论文·iriec
生信碱移1 天前
使用大语言模型的生物嵌入,后续应该会有很多类似文章出来!
人工智能·算法·语言模型·自然语言处理·chatgpt·数据分析