python绘图之箱型图

箱型图(Boxplot),也称为箱线图或盒须图,是一种用于展示一组数据的分布情况的统计图表。它通过简洁的图形形式,直观地呈现数据的集中趋势、离散程度、偏态以及异常值等信息。本节我们来学习使用python绘制箱型图

python 复制代码
# 导入必要的库
import pandas as pd  # 用于数据处理和分析
import numpy as np   # 用于数值计算
import seaborn as sns  # 用于数据可视化,专注于统计图表
import matplotlib.pyplot as plt  # 用于绘制图形

# 创建示例数据
# 设置随机种子以保证结果可复现,每次运行代码时生成的随机数都相同
np.random.seed(0)  

# 定义一个字典,包含两列数据:
# 'smoker' 列表示是否吸烟,随机生成 100 个 'no' 或 'yes',模拟是否吸烟的状态
# 'charges' 列表示医疗费用,使用伽马分布随机生成 100 个值,模拟医疗费用的分布
data = {
    'smoker': np.random.choice(['no', 'yes'], size=100),  # 随机生成 'no' 或 'yes'
    'charges': np.random.gamma(10, 2, size=100)  # 使用伽马分布生成医疗费用
}

# 将数据字典转换为 pandas DataFrame,方便后续处理和绘图
insurance = pd.DataFrame(data)

# 使用 seaborn 绘制箱线图
# x 参数指定分类变量(是否吸烟),y 参数指定数值变量(医疗费用)
# order 参数指定分类变量的显示顺序
sns.boxplot(x=insurance['smoker'], y=insurance['charges'], order=['no', 'yes'])

# 添加标题和轴标签,使图表更易于理解
plt.title('Medical Charges by Smoking Status')  # 图表标题
plt.xlabel('Smoking Status')  # x 轴标签
plt.ylabel('Charges')  # y 轴标签

# 显示图表
plt.show()
相关推荐
struggle20253 小时前
OramaCore 是您 AI 项目、答案引擎、副驾驶和搜索所需的 AI 运行时。它包括一个成熟的全文搜索引擎、矢量数据库、LLM界面和更多实用程序
人工智能·python·rust
chicpopoo4 小时前
Python打卡DAY40
人工智能·python·机器学习
waterHBO5 小时前
改进自己的图片 app
python
机器人梦想家5 小时前
【ROS2实体机械臂驱动】rokae xCoreSDK Python测试使用
python
开利网络5 小时前
数据资产化浪潮下,企业如何构建去中心化商业新生态?
大数据·数据库·人工智能·信息可视化·重构
代码讲故事6 小时前
解决 xmlsec.InternalError: (-1, ‘lxml & xmlsec libxml2 library version mismatch‘)
linux·python·pip·lxml·xmlsec·libxml2
MuQYun6 小时前
Pytorch的梯度控制
人工智能·pytorch·python
goldfishsky7 小时前
elasticsearch
开发语言·数据库·python
有颜有货7 小时前
什么是数据驱动?以及我们应如何理解数据驱动?
信息可视化·数据驱动
lanhuazui107 小时前
怎么从一台电脑拷贝已安装的所有python第三方库到另一台
python