pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用

  • DataFrame 是 pandas 中用于存储和操作二维表格数据的核心数据结构;
  • mean() 用于计算数据的平均值;
  • groupby() 实现按列分组后进行聚合分析;
  • fillna() 用于填充缺失值(NaN),保证数据完整性 。
python 复制代码
import pandas as pd
import numpy as np

data = {
        '姓名':['张三','李四','王五'],
        '年龄':[25,30,35],
        '城市':['北京','上海','广州'],
        '工资':[5000,8000,6000]}
df = pd.DataFrame(data)
print("原始数据:")
print(df)

#数据筛选
print("\n年龄大于27的员工:")
print(df[df['年龄']>27])

#分组统计
print("\n各城市平均工资水平:")
print(df.groupby('城市')['工资'].mean())

#处理缺失值
df_with_na = pd.DataFrame({'A':[1,2,np.nan,4],'B':[5,np.nan,np.nan,8]})
print("\n填充缺失值:")
print(df_with_na.fillna(df_with_na.mean()))

运行效果图:

相关推荐
2501_944934738 分钟前
中专学历如何通过数据分析提升电商运营竞争力
数据挖掘·数据分析
Tipriest_19 分钟前
深入理解 YOLO 训练中的 mAP50、mAP75 和 mAP50-95 指标
yolo·机器学习·目标跟踪
钮钴禄·爱因斯晨22 分钟前
机器学习(二):KNN算法简介及API介绍(分类、回归)
人工智能·算法·机器学习·分类·回归
AC赳赳老秦24 分钟前
Docker+DeepSeek:生成镜像优化Dockerfile与容器健康检查脚本
android·运维·人工智能·机器学习·docker·容器·deepseek
Python毕设指南31 分钟前
基于机器学习的农产品价格数据分析与预测系统
人工智能·机器学习·信息可视化·数据挖掘·数据分析·毕业设计
Hcoco_me39 分钟前
大模型面试题91:合并访存是什么?原理是什么?
人工智能·深度学习·算法·机器学习·vllm
yumgpkpm5 小时前
银行智能数据平台在Cloudera CDH6\CDP 7\CMP 7平台下的具体使用配置流程
大数据·hive·hadoop·数据挖掘·flink·spark·cloudera
KmjJgWeb9 小时前
工业零件检测与分类——基于YOLOv5的改进模型 Dysample 实现
yolo·分类·数据挖掘
虹科网络安全11 小时前
艾体宝方案 | 释放数据潜能 · 构建 AI 驱动的自动驾驶实时数据处理与智能筛选平台
人工智能·机器学习·自动驾驶
70asunflower11 小时前
基于锚点(聚类)的LLM微调
机器学习·数据挖掘·聚类