pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用

  • DataFrame 是 pandas 中用于存储和操作二维表格数据的核心数据结构;
  • mean() 用于计算数据的平均值;
  • groupby() 实现按列分组后进行聚合分析;
  • fillna() 用于填充缺失值(NaN),保证数据完整性 。
python 复制代码
import pandas as pd
import numpy as np

data = {
        '姓名':['张三','李四','王五'],
        '年龄':[25,30,35],
        '城市':['北京','上海','广州'],
        '工资':[5000,8000,6000]}
df = pd.DataFrame(data)
print("原始数据:")
print(df)

#数据筛选
print("\n年龄大于27的员工:")
print(df[df['年龄']>27])

#分组统计
print("\n各城市平均工资水平:")
print(df.groupby('城市')['工资'].mean())

#处理缺失值
df_with_na = pd.DataFrame({'A':[1,2,np.nan,4],'B':[5,np.nan,np.nan,8]})
print("\n填充缺失值:")
print(df_with_na.fillna(df_with_na.mean()))

运行效果图:

相关推荐
学历真的很重要3 小时前
PyTorch 机器学习工作流程基础 - 完整教程
人工智能·pytorch·后端·python·深度学习·机器学习·面试
老蒋新思维4 小时前
创客匠人启示录:AI 时代知识变现的底层逻辑重构 —— 从峰会实践看创始人 IP 的破局之路
网络·人工智能·网络协议·tcp/ip·数据挖掘·创始人ip·创客匠人
大千AI助手4 小时前
Softmax回归:原理、实现与多分类问题的基石
人工智能·机器学习·分类·数据挖掘·回归·softmax·大千ai助手
qq_436962185 小时前
奥威AI数据智能体:当BI遇上AI,企业数据分析的“确定性”革命
人工智能·数据挖掘·数据分析
老蒋新思维5 小时前
创客匠人深度洞察:创始人 IP 打造的非线性增长模型 —— 知识变现的下一个十年红利
大数据·网络·人工智能·tcp/ip·重构·数据挖掘·创客匠人
初九之潜龙勿用6 小时前
在openEuler操作系统基础上实现机器学习开发以及openEuler优势分析
人工智能·机器学习
小王毕业啦6 小时前
2007-2024年 地级市-公共数据开放DID
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
咚咚王者6 小时前
人工智能之数据分析 Pandas:第九章 性能优化
人工智能·数据分析·pandas
dhdjjsjs7 小时前
Day31 PythonStudy
人工智能·机器学习