pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用

  • DataFrame 是 pandas 中用于存储和操作二维表格数据的核心数据结构;
  • mean() 用于计算数据的平均值;
  • groupby() 实现按列分组后进行聚合分析;
  • fillna() 用于填充缺失值(NaN),保证数据完整性 。
python 复制代码
import pandas as pd
import numpy as np

data = {
        '姓名':['张三','李四','王五'],
        '年龄':[25,30,35],
        '城市':['北京','上海','广州'],
        '工资':[5000,8000,6000]}
df = pd.DataFrame(data)
print("原始数据:")
print(df)

#数据筛选
print("\n年龄大于27的员工:")
print(df[df['年龄']>27])

#分组统计
print("\n各城市平均工资水平:")
print(df.groupby('城市')['工资'].mean())

#处理缺失值
df_with_na = pd.DataFrame({'A':[1,2,np.nan,4],'B':[5,np.nan,np.nan,8]})
print("\n填充缺失值:")
print(df_with_na.fillna(df_with_na.mean()))

运行效果图:

相关推荐
啊阿狸不会拉杆22 分钟前
《机器学习导论》第 5 章-多元方法
人工智能·python·算法·机器学习·numpy·matplotlib·多元方法
铁蛋AI编程实战42 分钟前
MemoryLake 实战:构建超长对话 AI 助手的完整代码教程
人工智能·python·microsoft·机器学习
张较瘦_1 小时前
[论文阅读] AI | 用机器学习给深度学习库“体检”:大幅提升测试效率的新思路
论文阅读·人工智能·机器学习
算法狗21 小时前
大模型面试题:大模型的训练和推理中显存和计算量的情况
人工智能·深度学习·机器学习·语言模型
我材不敲代码1 小时前
机器学习入门 04逻辑回归part2——提高逻辑回归模型的召回率
人工智能·机器学习·逻辑回归
渡我白衣2 小时前
信而有征——模型评估、验证与可信部署的完整体系
人工智能·深度学习·神经网络·目标检测·机器学习·计算机视觉·自然语言处理
铁蛋AI编程实战2 小时前
DeepSeek mHC解析(流形约束超连接)
人工智能·深度学习·机器学习
AAD5558889910 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
fanstuck11 小时前
从0到提交,如何用 ChatGPT 全流程参与建模比赛的
大数据·数学建模·语言模型·chatgpt·数据挖掘
zhangfeng113313 小时前
氨基酸序列表示法,蛋白质序列表达 计算机中机器学习 大语言模型中的表达,为什么没有糖蛋白或者其他基团磷酸化甲基化乙酰化泛素化
人工智能·机器学习·语言模型