Python数据分析-Steam 收入排名前 1500 的游戏

一、研究背景

随着全球数字化进程的加速,电子游戏产业已成为全球娱乐产业的重要组成部分,吸引了越来越多的资本与消费者关注。特别是基于互联网的游戏平台,如Steam,已成为全球范围内发行和销售游戏的重要渠道。Steam平台不仅为玩家提供了丰富的游戏内容,还为开发商和发行商提供了一个展示作品、与玩家互动、获得市场反馈的开放平台。截至2024年,Steam已经成为全球最具影响力的游戏平台之一,拥有数千万活跃用户和海量游戏作品。通过该平台,众多独立开发者以及大型游戏公司都能在全球范围内获得广泛的市场曝光。

近年来,随着游戏市场的竞争日益激烈,开发商和发行商不仅需要确保游戏的质量,还必须掌握市场的动态变化,如玩家的偏好、消费习惯、游戏定价策略、市场营销方式等。这些因素在很大程度上决定了一款游戏的成功与否。与此同时,玩家的参与度、游戏的口碑和评论得分等指标也日益成为衡量游戏市场表现的重要参数。

本研究基于2024年1月1日至9月9日期间,Steam平台上发布的前1500款游戏数据,旨在通过对这些游戏的销售数据、收入、玩家参与度、评论评分、开发商和发行商背景等多维度数据的深入分析,揭示影响游戏市场表现的关键因素。通过分析这些游戏的市场表现及其背后的市场机制,我们希望为未来的游戏开发与发行提供数据支持和策略参考。

二、研究意义

本研究的意义体现在以下几个方面:

  1. 市场洞察

    随着游戏产业的飞速发展,市场上的游戏种类和数量呈现爆发式增长。通过对Steam平台前1500款收入最高游戏的深入分析,本研究能够揭示哪些类型的游戏在市场上更受欢迎,以及影响其销量和收入的关键因素。这对于游戏开发商在未来制定开发方向、优化游戏设计有着重要的指导意义。

  2. 定价策略优化

    本研究通过分析游戏定价、销售量与收入之间的关系,帮助开发商和发行商更好地理解不同定价策略的效果。例如,价格是否对销量有显著影响,或者高价是否必然意味着高质量或高收益的游戏。这将为未来的定价决策提供实证支持,帮助开发商在市场中获得更好的经济回报。

  3. 玩家行为与市场反馈

    玩家参与度、平均游戏时长、评论分数等指标是衡量游戏受欢迎程度和质量的重要标准。本研究通过分析这些玩家行为数据,可以帮助开发商理解哪些因素最能影响玩家的忠诚度和留存率。通过研究这些行为模式,开发商可以更有针对性地改进游戏内容和优化用户体验。

  4. 开发商和发行商分析

    不同规模的开发商和发行商在游戏市场中的表现差异显著。本研究可以揭示大公司与独立开发者之间的竞争优势和劣势,并帮助小型开发商找到在竞争激烈的市场中脱颖而出的策略。同时,研究还可以揭示发行商在游戏营销和推广中的重要作用,从而为未来的发行合作提供参考。

  5. 趋势预测与市场策略

    通过对市场动态数据的分析,本研究还可以为游戏市场未来的发展趋势提供参考。通过研究销售排名和价格波动等数据,预测未来游戏市场可能的发展方向。这为游戏开发者和发行商在市场定位、资源分配和营销策略上提供了前瞻性的建议。

三、实证分析

此数据集包含 2024 年 1 月 1 日至 2024 年 9 月 9 日期间在 Steam 上发布的前 1500 款游戏的全面信息。进行了细微的调整,例如调整游戏发布日期以保持一致性。

主要特点: 游戏详情: 包括标题、发布日期和开发商/发行商信息。

Sales and Revenue:跟踪售出的副本数、产生的收入和定价详细信息。

玩家参与度:提供平均游戏时间、峰值玩家数量和其他用户参与度指标。

评论和分数:特色评论分数和评级。

动态市场数据:提供对游戏性能随时间变化趋势的见解,例如销售排名和价格波动。

导入数据包

代码和数据

python 复制代码
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import seaborn as sns 
import warnings 
warnings.filterwarnings('ignore')

读取数据

python 复制代码
data =pd.read_csv(r"Steam_2024_bestRevenue_1500.csv")
data

数据缺失值查看

发现存在缺失值,需进行处理

python 复制代码
data.duplicated().sum()

查看数据具体情况

python 复制代码
data.info()

查看NAME

python 复制代码
data.name.value_counts()

查看一下每个特征的MAX

python 复制代码
data.copiesSold.max()

data[data['copiesSold']==30739148]

价格最高的游戏

python 复制代码
data.price.max()

data[data['price']==99.99]

税收最高的游戏

python 复制代码
data.revenue.max()

data[data['revenue']==837793356.0]

价格与税收的散点图

python 复制代码
plt.scatter(data.price,data.revenue,color='red')
plt.xlabel('price')
plt.ylabel('revenue')
python 复制代码
plt.figure(figsize=(6,4))
sns.histplot(data['price'],bins=20,kde=True,color='green',edgecolor="black")
plt.title("Distribution of Game Prices")
plt.xlabel("Price ($)")
plt.ylabel('Number of Games')
plt.show()
python 复制代码
plt.figure(figsize=(6,4))
plt.pie(data.publisherClass.value_counts(), labels=data.publisherClass.value_counts().index, autopct='%1.1f%%', 
        colors=['#ff9999', '#ff66b3', '#99ff99', '#ffcc99'])
plt.title('Distribution of Games by Publisher Class')
plt.show()

数据描述性统计

该数据包含了游戏的发布日期、销量、价格、收入、平均游戏时长、评论分数和 steam 编号等信息,统计了 1500 个数据,发布日期在 2024 年 1 月 1 日到 2024 年 9 月 6 日之间,销量最少 593 最多 30739150,价格从 0 到 99.99,收入最少 20674 最多 837793400,平均游戏时长最少 0 最多 296.332852,评论分数在 0 到 100 之间,同时给出了各项数据的均值、25%、50%、75% 分位数以及标准差等统计信息。

相关系数热力图

python 复制代码
sns.heatmap(data_corr)   
plt.title('Correlation Heatmap')
plt.show()
python 复制代码
plt.figure(figsize=(6, 4))
sns.boxplot(data=data, x='publisherClass', y='reviewScore', palette='Set2')
plt.title('Review Scores by Publisher Class')
plt.xlabel('Publisher Class')
plt.ylabel('Review Score')
plt.xticks(rotation=45)
plt.grid(True)
plt.show()
python 复制代码
sns.scatterplot(data=data, x='reviewScore', y='avgPlaytime', hue='publisherClass')
python 复制代码
sns.boxplot(x='publisherClass', y='price', data=data)

python 复制代码
data.groupby('releaseDate')['revenue'].sum().plot(kind='line', title='Revenue Over Time')

四、结论

通过对2024年Steam平台前1500款游戏的多维度数据分析,本研究得出了以下结论:

  1. 游戏类型和市场表现密切相关

    不同类型的游戏在市场上的表现差异明显。动作类、角色扮演类(RPG)和多人在线竞技类游戏(MOBA)在市场中表现突出,吸引了大量玩家和收入。而休闲类、独立游戏等虽然销量相对较少,但凭借较低的开发成本和针对性强的玩家群体,也在特定细分市场中占据一席之地。

  2. 玩家参与度和评论评分对游戏销售影响显著

    玩家参与度高的游戏通常在市场上表现较好。游戏的平均时长、峰值玩家数、游戏评论评分等指标能够直接反映玩家对游戏的喜爱程度和满意度。特别是评论分数较高的游戏,往往更容易获得长期的市场认可和稳定的玩家基础。

  3. 定价策略影响销售收入

    定价策略对于游戏的市场表现有着显著影响。本研究发现,高价格的游戏通常意味着较高的开发成本和质量保障,但也可能导致潜在玩家群体的减少。而较低的定价虽然能够吸引更多的玩家,但在收入方面未必能带来预期的增长。因此,如何制定合理的定价策略以平衡销量与收入,成为开发商和发行商需要重点考虑的问题。

  4. 开发商与发行商的市场角色

    大型开发商和发行商通常在市场中占据主导地位,它们拥有更多的资源和市场推广能力,因此更容易获得较高的销量和收入。然而,独立开发者也有机会通过创新和差异化策略,在细分市场中取得成功。尤其是一些独立游戏通过创新的玩法和独特的艺术风格,获得了广泛的市场认可。

总的来说,本研究为游戏开发者、发行商以及相关从业者提供了关于游戏市场表现的关键洞察。未来的研究可以进一步细化到不同地区市场、玩家行为模式的差异性,探讨更多的影响因素,以帮助游戏行业在全球范围内实现持续增长和创新。

相关推荐
肥猪猪爸21 分钟前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
LZXCyrus1 小时前
【杂记】vLLM如何指定GPU单卡/多卡离线推理
人工智能·经验分享·python·深度学习·语言模型·llm·vllm
Enougme1 小时前
Appium常用的使用方法(一)
python·appium
懷淰メ1 小时前
PyQt飞机大战游戏(附下载地址)
开发语言·python·qt·游戏·pyqt·游戏开发·pyqt5
hummhumm1 小时前
第 22 章 - Go语言 测试与基准测试
java·大数据·开发语言·前端·python·golang·log4j
hummhumm1 小时前
第 28 章 - Go语言 Web 开发入门
java·开发语言·前端·python·sql·golang·前端框架
每天吃饭的羊2 小时前
python里的数据结构
开发语言·python
卡卡_R-Python2 小时前
UCI Heart Disease Data Set—— UCI 心脏病数据集介绍
python·plotly·django·virtualenv·pygame
饮长安千年月2 小时前
浅谈就如何解出Reverse-迷宫题之老鼠走迷宫的一些思考
python·网络安全·逆向·ctf
好看资源平台2 小时前
网络爬虫——爬虫项目案例
爬虫·python