学习笔记(32):matplotlib绘制简单图表-数据分布图

学习笔记(32):matplotlib绘制简单图表-数据分布图

1、引用

import seaborn as sns

import pandas as pd

import matplotlib.pyplot as plt

这部分是导入必要的库:

  • seaborn 提供高级数据可视化功能
  • pandas 用于数据处理
  • matplotlib.pyplot 提供基础绘图功能

2、导入数据和创建图

2.1、导入数据

data = pd.read_csv('../../data/data.csv')

使用 pandas 读取 CSV 文件并将数据存储在data变量中。文件路径../../data/data.csv表示向上两级目录后进入 data 文件夹读取 data.csv 文件。

data.csv

name,age,score

Alice,12,66

lisa,15,88

helen,18,78

alisa,12,96

jerry,20,55

Bob,25,70

sally,18,85

2.2、单变量分布

单变量分布(直方图+核密度估计)

sns.histplot(data'age', kde=True)

plt.title('Distribution of age')

plt.xlabel('Age')

plt.ylabel('Density') # 对于带KDE的直方图

plt.show()

  1. sns.histplot(data['age'], kde=True) - 使用 seaborn 绘制 age 列的直方图,并启用核密度估计 (KDE)
  2. plt.title('Distribution of age') - 设置图表标题
  3. plt.xlabel('Age')plt.ylabel('Density') - 设置坐标轴标签
  4. plt.show() - 显示图表

2.3、多变量联合分布可视化:

多变量联合分布

g = sns.jointplot(x='age', y='score', data=data, kind='scatter')

g.fig.suptitle('Age vs Score') # 添加联合分布图的标题

plt.subplots_adjust(top=0.9) # 调整标题位置

plt.show()

  1. sns.jointplot(...) - 创建一个联合分布图,展示 age 和 score 两列之间的关系
    • x='age'y='score' - 指定要绘制的两个变量
    • data=data - 指定数据源
    • kind='scatter' - 指定散点图类型

这段代码类似:sns.jointplot(x=data'age', y=data'score', kind='scatter')

  1. g.fig.suptitle('Age vs Score') - 设置整个联合分布图的标题
  2. plt.subplots_adjust(top=0.9) - 调整图表布局,为标题腾出空间
  3. plt.show() - 显示图表

2.4、总结

这段代码通过 seaborn 库实现了两种常见的数据可视化:

  1. 单变量分析 - 展示 age 列的分布情况,使用直方图和核密度估计曲线
  2. 双变量分析 - 展示 age 和 score 之间的关系,使用散点图

这两种可视化方式可以帮助数据分析师快速了解数据的分布特征和变量间的关系。

3、代码和执行结果

python 复制代码
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('../../data/data.csv')

# 单变量分布(直方图+核密度估计)
sns.histplot(data['age'], kde=True)
plt.title('Distribution of age')
plt.xlabel('Age')
plt.ylabel('Density')  # 对于带KDE的直方图
plt.show()

# 多变量联合分布
g=sns.jointplot(x='age', y='score', data=data, kind='scatter')
g.fig.suptitle('Age vs Score')  # 添加联合分布图的标题
plt.subplots_adjust(top=0.9)    # 调整标题位置
plt.show()

执行结果:

图一:

图二:

相关推荐
Esaka_Forever31 分钟前
few‑shot learning(少样本学习)
人工智能·学习
中屹指纹浏览器1 小时前
2026指纹浏览器行为指纹对抗技术详解:从算法识别到真人模拟全方案
经验分享·笔记
川石课堂软件测试2 小时前
零基础小白如何学习自动化测试
python·功能测试·学习·测试工具·jmeter·压力测试·harmonyos
2301_809051142 小时前
Linux 数据库开发 学习笔记
笔记·学习·数据库开发
爱喝水的鱼丶2 小时前
SAP-ABAP:SAP 简单报表输出开发系列(共6篇)第三篇:SAP ALV 报表样式定制:字段布局与交互功能配置
服务器·开发语言·学习·交互·sap·abap
很楠爱上2 小时前
Node.js 模块化学习笔记
笔记·学习·node.js
mnasd2 小时前
RockyLinux 9.5 部署 Kubernetes1.35 集群
笔记
毕竟是shy哥2 小时前
CLIP:从自然语言监督中学习可迁移的视觉模型
学习
川石课堂软件测试2 小时前
作为一名测试工程师如何学习Kubernetes(k8s)技能
学习·测试工具·容器·职场和发展·kubernetes·测试用例·harmonyos
tryqaaa_2 小时前
学习日志(五)【php反序列化全加例题】【pop链,字符逃逸,session,伪协议】
android·学习·php·web·pop·session