matplotlib实战--雷达图

雷达图(Radar Chart),也被称为蛛网图或星型图,是一种用于可视化多个变量之间关系的图表形式。

雷达图是一种显示多变量数据的图形方法。通常从同一中心点开始等角度间隔地射出三个以上的轴,每个轴代表一个定量变量,各轴上的点依次连接成线或几何图形。

雷达图可以用来在变量间进行对比,或者查看变量中有没有异常值。

雷达图中每个轴的相对位置和角度通常是无信息的。每个变量都具有自己的轴,彼此间的距离相等,所有轴都有相同的刻度。

在将数据映射到这些轴上时,需要注意预先对数值进行标准化处理,保证各个轴之间的数值比例能够做同级别的比较。

1. 主要元素

雷达图的主要元素包括:

  1. 坐标轴:每个变量对应一个射线或轴线,从中心点向外延伸。射线的长度或角度表示该变量的值大小或比例。
  2. 数据点:在每个射线上,根据变量的值确定相应的数据点或标记点的位置。
  3. 雷达链:连接各个数据点或标记点形成的多边形或区域,用于表示多个变量之间的关系。
  4. 区域范围:雷达链所连接的区域,面积大小代表各个数据综合的结果。

2. 适用的场景

雷达图适用的分析场景包括:

  • 比较综合表现:比较多个实体(如产品、团队、个人等)在多个指标上的表现,帮助决策者了解它们之间的差异和相对优劣。
  • 评估绩效和目标:帮助评估绩效和目标达成情况,从而指导后续决策和改进措施。
  • 变量之间的关系趋势:直观地发现多个变量之间的关系和趋势,例如某个变量的增长是否会导致其他变量的变化。
  • 强调优势和劣势:凸显实体在某些指标上的优势和劣势,有助于决策者更好地了解实体的特点和优势所在。

3. 不适用的场景

雷达图不适用的分析场景有:

  • 无序数据:如果数据是无序的,无法明确确定各个变量之间的相对位置和关系,雷达图的效果会大打折扣。
  • 数据缺失:如果某些变量的数据缺失或不完整,将导致雷达图无法准确地展示各个变量之间的关系和差异。
  • 多个并行路径:当存在多个并行路径时,例如多个团队或产品之间的比较,雷达图可能无法清晰地展示它们之间的差异和相对优劣。

4. 分析实战

本次通过雷达图来分析下王者荣耀KPL联盟几位选手的比赛数据。

4.1. 数据来源

数据来自王者荣耀官网(2023年春季赛数据),整理好的数据可以从下面下载:
databook.top/wzry/2023-s...

使用其中的文件:player-2023春季赛.csv

python 复制代码
fp = "d:/share/data/player-2023春季赛.csv"

df = pd.read_csv(fp)
df

4.2. 数据清理

选手的数据一共有125条,本来想按胜率选择最高 的4位选手,发现胜率高的选手很多只参加了1,2场比赛。

所以选择参加比赛最多6位选手来分析。

python 复制代码
data = df.sort_values("比赛场次", ascending=False)
data = data.iloc[:6]
data

选择每位选手下列5个属性来绘制雷达图:

  1. 经济占比
  2. 伤害占比
  3. 承伤占比
  4. 推塔占比
  5. 参团率
python 复制代码
filter_cols = ["选手", "经济占比", "伤害占比", "承伤占比", "推塔占比", "参团率"]
data = data.loc[:, filter_cols]
data

将百分比数据转为数值类型:

python 复制代码
for col in filter_cols[1:]:
    data[col] = data[col].str.replace("%", "", regex=False)
    data[col] = data[col].astype("float")

data

4.3. 分析结果可视化

绘制6位选手的雷达图:

python 复制代码
N = 5 # 雷达图属性个数
angles = np.linspace(0, 2 * np.pi, N, endpoint=False)
angles = np.concatenate((angles, [angles[0]]))

fig = plt.figure(figsize=[10, 6])
for i in range(len(data)):
    values = data.iloc[i, 1:].tolist()
    values.append(values[0])

    position = "23" + str(i + 1)
    ax = fig.add_subplot(int(position), polar=True)
    ax.plot(angles, values, "o-")
    ax.fill(angles, values, alpha=0.4)
    ax.set_thetagrids(angles[:-1] * 180 / np.pi,
                      data.columns[1:].tolist())
    ax.set_title(data.iloc[i, 0], color="b")
    ax.set_ylim(0, 100)

plt.subplots_adjust(hspace=0.5)

参赛最多的6位选手,5位都是佛山DRG 的队员,说明他们的首发阵容很稳定。
5个属性 连接起来的面积 ,看起来还是射手打野 的比较大,C位果然还是得看这两个位置。

相关推荐
Srlua1 小时前
周期性移动模式地铁乘客流量预测
python·数据分析
Tianyanxiao13 小时前
【探商宝】大数据获客平台在销售型企业中的应用
大数据·经验分享·科技·数据分析
AI完全体14 小时前
【AI日记】24.11.25 学习谷歌数据分析初级课程-第6课
学习·数据分析
枝上棉蛮15 小时前
报表工具功能对比:免费易上手的山海鲸报表 vs 庞大用户群体的Tableau
信息可视化·数据挖掘·数据分析·数字孪生·中国式报表·报表制作工具·免费报表软件
阡之尘埃19 小时前
Python数据分析案例65——基于深度学习的音频文件分类(音频文件特征提取和模型构建)
python·深度学习·分类·数据分析·数据可视化·音频文件
标贝科技1 天前
标贝科技:自动驾驶中的数据标注类别分享
数据库·人工智能·ai·数据挖掘·数据分析·自动驾驶·数据标注
敲代码不忘补水1 天前
Python Matplotlib 经典 3D 绘图类型:从二维到三维的可视化解析
开发语言·python·3d·数据分析·numpy·pandas·matplotlib
namisoft1231 天前
如何利用ATECLOUD平台来实现数据报告的导出和数据分析?-纳米软件
信息可视化·数据分析·atecloud测试平台
AI小杨1 天前
【数据分析】一、pandas数据处理指南:100个基于pandas数据预处理方法
python·数据挖掘·数据分析·pandas·pandas使用技巧
牛猫Data1 天前
提升数据分析效率:Excel Power Query和Power Pivot的妙用
microsoft·数据分析·excel·数据可视化·powerbi