pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用

  • DataFrame 是 pandas 中用于存储和操作二维表格数据的核心数据结构;
  • mean() 用于计算数据的平均值;
  • groupby() 实现按列分组后进行聚合分析;
  • fillna() 用于填充缺失值(NaN),保证数据完整性 。
python 复制代码
import pandas as pd
import numpy as np

data = {
        '姓名':['张三','李四','王五'],
        '年龄':[25,30,35],
        '城市':['北京','上海','广州'],
        '工资':[5000,8000,6000]}
df = pd.DataFrame(data)
print("原始数据:")
print(df)

#数据筛选
print("\n年龄大于27的员工:")
print(df[df['年龄']>27])

#分组统计
print("\n各城市平均工资水平:")
print(df.groupby('城市')['工资'].mean())

#处理缺失值
df_with_na = pd.DataFrame({'A':[1,2,np.nan,4],'B':[5,np.nan,np.nan,8]})
print("\n填充缺失值:")
print(df_with_na.fillna(df_with_na.mean()))

运行效果图:

相关推荐
MemoriKu3 分钟前
Flutter 相册 APP 视频模态稳定化实战:从远端重构冲突到真机 Smoke Test
人工智能·python·flutter·机器学习·重构·音视频·新人首发
好评笔记8 分钟前
深度学习面试八股—— GRU(Gated Recurrent Unit)
人工智能·rnn·深度学习·算法·机器学习·gru·校招
YangYang9YangYan13 分钟前
大数据管理与应用专业学数据分析的价值
数据挖掘·数据分析
搞科研的小刘选手14 分钟前
【智能计算方向专题研讨会】第三届智能计算与数据分析国际学术会议(ICDA 2026)
大数据·算法·机器学习·数据挖掘·数据分析·可视化·计算
疯狂打码的少年17 分钟前
【程序语言与编译】文法的分类(0-3型,乔姆斯基体系)
人工智能·笔记·分类·数据挖掘
小糖学代码23 分钟前
机器学习:6.卷积神经网络与循环神经网络
人工智能·rnn·机器学习·cnn
高洁0136 分钟前
知识图谱与推荐系统实战
深度学习·机器学习·transformer·virtualenv·知识图谱
七夜zippoe40 分钟前
DolphinDB机器学习函数:内置ML能力
人工智能·机器学习·ml·dolphindb·内置
Promise微笑42 分钟前
气体露点仪测量技术:露点仪原理、分类、选型与应用前沿
人工智能·分类·数据挖掘
进击切图仔1 小时前
确保深度神经网络在训练过程中的数值稳定性
人工智能·机器学习·dnn