Python数据分析之绘制相关性热力图的完整教程

前言

文章将介绍如何使用Python中的Pandas和Seaborn库来读取数据、计算相关系数矩阵,并绘制出直观、易于理解的热力图。我们将逐步介绍代码的编写和执行过程,并提供详细的解释和示例,以便读者能够轻松地跟随和理解。

大家记得需要准备以下条件数据:(大家可以看我上一篇文章
  • 确保数据集是干净的,没有缺失值或异常值。
  • 只选择数值型数据列进行相关性分析。
第一步:导入库
python 复制代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
第二步:加载数据
python 复制代码
data = pd.read_excel("result1_1.xlsx")
第三步:数据转换
python 复制代码
data = data.apply(pd.to_numeric, errors='coerce')

这行代码使用pandas的apply方法结合to_numeric函数,将数据框(data frame)data中的每一列尝试转换为数值类型。errors='coerce'参数意味着在转换过程中,如果遇到无法转换为数值的元素,将替换为NaN

第四步:计算相关性矩阵
python 复制代码
correlation_matrix = data.corr()

这行代码计算数据框data中所有列之间的相关系数,并将结果存储在correlation_matrix中。

第五步:绘制热力图
python 复制代码
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f')
plt.title('Correlation Heatmap')
plt.show()

这些代码行设置图表的大小,然后使用seaborn的heatmap函数绘制一个热力图,其中annot=True表示在热力图上显示每个单元格的具体数值,cmap='coolwarm'设置了颜色映射为coolwarm,fmt='.2f'设置了数值的格式为两位小数。最后,设置图表的标题为'Correlation Heatmap',并使用plt.show()显示图表。

第六步:查看效果

整个代码执行后,您将看到一个包含数据列之间相关系数的热力图,这有助于您可视化数据之间的关系!

本篇文章到这里就结束了,大家去试试自己的吧,点赞投币加收藏~

相关推荐
雨季66616 小时前
构建 OpenHarmony 简易文字行数统计器:用字符串分割实现纯文本结构感知
开发语言·前端·javascript·flutter·ui·dart
雨季66616 小时前
Flutter 三端应用实战:OpenHarmony 简易倒序文本查看器开发指南
开发语言·javascript·flutter·ui
进击的小头17 小时前
行为型模式:策略模式的C语言实战指南
c语言·开发语言·策略模式
天马379817 小时前
Canvas 倾斜矩形绘制波浪效果
开发语言·前端·javascript
Tansmjs17 小时前
C++与GPU计算(CUDA)
开发语言·c++·算法
喵手17 小时前
Python爬虫零基础入门【第九章:实战项目教学·第15节】搜索页采集:关键词队列 + 结果去重 + 反爬友好策略!
爬虫·python·爬虫实战·python爬虫工程化实战·零基础python爬虫教学·搜索页采集·关键词队列
qx0917 小时前
esm模块与commonjs模块相互调用的方法
开发语言·前端·javascript
Suchadar17 小时前
if判断语句——Python
开发语言·python
ʚB҉L҉A҉C҉K҉.҉基҉德҉^҉大18 小时前
自动化机器学习(AutoML)库TPOT使用指南
jvm·数据库·python
喵手18 小时前
Python爬虫零基础入门【第九章:实战项目教学·第14节】表格型页面采集:多列、多行、跨页(通用表格解析)!
爬虫·python·python爬虫实战·python爬虫工程化实战·python爬虫零基础入门·表格型页面采集·通用表格解析