python绘图之箱型图

箱型图(Boxplot),也称为箱线图或盒须图,是一种用于展示一组数据的分布情况的统计图表。它通过简洁的图形形式,直观地呈现数据的集中趋势、离散程度、偏态以及异常值等信息。本节我们来学习使用python绘制箱型图

python 复制代码
# 导入必要的库
import pandas as pd  # 用于数据处理和分析
import numpy as np   # 用于数值计算
import seaborn as sns  # 用于数据可视化,专注于统计图表
import matplotlib.pyplot as plt  # 用于绘制图形

# 创建示例数据
# 设置随机种子以保证结果可复现,每次运行代码时生成的随机数都相同
np.random.seed(0)  

# 定义一个字典,包含两列数据:
# 'smoker' 列表示是否吸烟,随机生成 100 个 'no' 或 'yes',模拟是否吸烟的状态
# 'charges' 列表示医疗费用,使用伽马分布随机生成 100 个值,模拟医疗费用的分布
data = {
    'smoker': np.random.choice(['no', 'yes'], size=100),  # 随机生成 'no' 或 'yes'
    'charges': np.random.gamma(10, 2, size=100)  # 使用伽马分布生成医疗费用
}

# 将数据字典转换为 pandas DataFrame,方便后续处理和绘图
insurance = pd.DataFrame(data)

# 使用 seaborn 绘制箱线图
# x 参数指定分类变量(是否吸烟),y 参数指定数值变量(医疗费用)
# order 参数指定分类变量的显示顺序
sns.boxplot(x=insurance['smoker'], y=insurance['charges'], order=['no', 'yes'])

# 添加标题和轴标签,使图表更易于理解
plt.title('Medical Charges by Smoking Status')  # 图表标题
plt.xlabel('Smoking Status')  # x 轴标签
plt.ylabel('Charges')  # y 轴标签

# 显示图表
plt.show()
相关推荐
纪元A梦30 分钟前
华为OD机试真题——荒岛求生(2025A卷:200分)Java/python/JavaScript/C/C++/GO最佳实现
java·c语言·javascript·c++·python·华为od·go
Mi Manchi262 小时前
力扣热题100之搜索二维矩阵 II
python·leetcode·矩阵
电商数据girl2 小时前
【Python爬虫电商数据采集+数据分析】采集电商平台数据信息,并做可视化演示
java·开发语言·数据库·爬虫·python·数据分析
仰望星空的凡人2 小时前
【JS逆向基础】WEB自动化
python
明月看潮生2 小时前
Windows_PyCharm Python语言开发环境构建
windows·python·青少年编程·pycharm·编程与数学
生信碱移3 小时前
TCGA数据库临床亚型可用!贝叶斯聚类+特征网络分析,这篇 NC 提供的方法可以快速用起来了!
人工智能·python·算法·数据挖掘·数据分析
测试老哥3 小时前
Selenium使用指南
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
小白学大数据3 小时前
分布式爬虫去重:Python + Redis实现高效URL去重
开发语言·分布式·爬虫·python
Nina_7173 小时前
python简易实现勒索病毒
网络·python·网络安全
小江-4 小时前
基于计算机视觉的试卷答题区表格识别与提取技术
python·ocr