pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用

  • DataFrame 是 pandas 中用于存储和操作二维表格数据的核心数据结构;
  • mean() 用于计算数据的平均值;
  • groupby() 实现按列分组后进行聚合分析;
  • fillna() 用于填充缺失值(NaN),保证数据完整性 。
python 复制代码
import pandas as pd
import numpy as np

data = {
        '姓名':['张三','李四','王五'],
        '年龄':[25,30,35],
        '城市':['北京','上海','广州'],
        '工资':[5000,8000,6000]}
df = pd.DataFrame(data)
print("原始数据:")
print(df)

#数据筛选
print("\n年龄大于27的员工:")
print(df[df['年龄']>27])

#分组统计
print("\n各城市平均工资水平:")
print(df.groupby('城市')['工资'].mean())

#处理缺失值
df_with_na = pd.DataFrame({'A':[1,2,np.nan,4],'B':[5,np.nan,np.nan,8]})
print("\n填充缺失值:")
print(df_with_na.fillna(df_with_na.mean()))

运行效果图:

相关推荐
阿正的梦工坊2 小时前
Kronecker积详解
人工智能·深度学习·机器学习
手揽回忆怎么睡4 小时前
Streamlit学习实战教程级,一个交互式的机器学习实验平台!
人工智能·学习·机器学习
540_5405 小时前
ADVANCE Day32
人工智能·python·机器学习
STLearner5 小时前
AAAI 2026 | 图基础模型(GFM)&文本属性图(TAG)高分论文
人工智能·python·深度学习·神经网络·机器学习·数据挖掘·图论
byzh_rc6 小时前
[模式识别-从入门到入土] 专栏总结
人工智能·机器学习
natide7 小时前
表示/嵌入差异-7-间隔/边际对齐(Alignment Margin)
人工智能·深度学习·算法·机器学习·自然语言处理·知识图谱
路人与大师8 小时前
大规模多变量AutoML调参实验报告
人工智能·深度学习·机器学习
夏日白云9 小时前
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
图像处理·机器学习·pdf·llm·大语言模型·rag·文档解析
liu****9 小时前
02_Pandas_数据结构
数据结构·python·pandas·python基础
生信碱移10 小时前
单细胞空转CNV分析工具:比 inferCNV 快10倍?!兼容单细胞与空转的 CNV 分析与聚类,竟然还支持肿瘤的亚克隆树构建!
算法·机器学习·数据挖掘·数据分析·聚类