Pandas DataFrame 指南

📊 Pandas DataFrame 常用操作代码示例

下面用表格汇总了 DataFrame 的常用操作,方便你快速查阅和实践。

操作类别 代码示例 说明(简要)
数据读取 df = pd.read_csv('data.csv') 读取 CSV 文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1') 读取 Excel 文件
df = pd.read_clipboard() 从剪贴板中读取数据,并将其转换为 DataFrame
数据查看 df.head() 查看前 5 行数据
df.info() 查看数据基本信息(行数、列类型、非空值等)
df.describe() 生成描述性统计信息(均值、标准差、分位数等)
数据清洗 df.dropna() 删除包含缺失值的行
df.fillna(value) 填充缺失值
df.drop_duplicates() 删除重复行
数据选择 df['column_name'] 选择单列
df[['col1', 'col2']] 选择多列
df.loc[row_index, col_name] 按标签选择数据
df.iloc[row_idx, col_idx] 按位置选择数据
df.query('A > 10 & B < 12') 使用查询表达式筛选数据
数据排序 df.sort_values('column_name', ascending=False) 按指定列的值降序排序
df.nlargest(5, 'column_name') 获取某列最大的前 5 行数据
数据分组聚合 df.groupby('column_name')['other_column'].mean() 按列分组并计算另一列的均值
df.groupby(['col1', 'col2']).agg({'col3': 'mean', 'col4': 'sum'}) 多列分组并进行多种聚合操作
数据合并 pd.merge(df1, df2, on='key_column') 基于键列合并两个 DataFrame
pd.concat([df1, df2], axis=0) 沿行方向拼接两个 DataFrame (axis=1 为列方向)
数据处理 df['new_column'] = df['existing_column'].apply(lambda x: x*2) 对列应用函数创建新列
df['date_column'] = pd.to_datetime(df['date_column']) 转换日期列格式
数据输出 df.to_csv('output.csv', index=False) 输出到 CSV 文件(不包含索引列)

💡 一些实用技巧

  • 条件筛选df[(df['Age'] <= 25) & (df['Gender'] == '女')] 可以筛选出年龄小于等于25岁的女性 。
  • 处理缺失值df.dropna(subset=['column_name']) 可仅删除指定列中有缺失值的行 。
  • 字符串处理df['title'].str.split(' ').str[0] 可用于分割字符串并取第一部分 。

📚 精选Pandas学习资源

要系统学习 Pandas,优质资源很重要。下表汇总了一些推荐的学习资源:

资源类型 资源名称 作者/提供方 特点与简介
官方文档 10 Minutes to pandas Pandas 官方快速入门指南,虽不止10分钟但内容精炼。
教程系列 pandas 教程三部曲 Greg Reda 经典入门教程,适合初学者 。
实用指南 給 aspiring data scientist 的 pandas 實戰手冊 LeeMeng 近 40 个实用技巧,由浅入深 。
相关书籍 《Python for Data Analysis》 Wes McKinney (Pandas创作者) 系统介绍利用 Python进行数据分析,涵盖 IPython, NumPy, Pandas 。
针对性指南 在Pandas中的常规Excel操作 帮助有 Excel 背景的用户快速适应 Pandas 。
从SQL到pandas Greg Reda 帮助从 SQL 迁移到 Pandas 的用户 。
视频课程 Pandas 视频教程 David 9 系列视频和 Jupyter notebook 笔记本 。
备忘单 Pandas Cheat Sheet Pandas 官方提供的速查表,方便快速查找常用操作。

学习建议

  1. 边学边练:Pandas 的最佳学习方式是实际操作。可以在 Jupyter Notebook 或 Google Colab 中运行代码。
  2. 从实际问题出发:尝试用 Pandas 分析和处理你感兴趣的数据集。
  3. 善用官方文档:遇到函数用法不明确时,官方文档是最权威的参考。
  4. 参与社区:在 Stack Overflow 等社区提问和浏览,可以学到很多实战技巧。
相关推荐
Yokon_D3 小时前
Pycharm终端pip install的包都在C:\Users\\AppData\Roaming\Python\解决办法
python·pycharm·pip
爱补鱼的猫猫4 小时前
pytorch可视化工具(训练评估:Tensorboard、swanlab)
人工智能·pytorch·python
川石课堂软件测试4 小时前
Oracle 数据库使用事务确保数据的安全
数据库·python·功能测试·docker·oracle·单元测试·prometheus
moxiaoran57535 小时前
Python学习笔记--使用Django修改和删除数据
笔记·python·学习
山烛5 小时前
OpenCV 模板匹配
人工智能·python·opencv·计算机视觉·目标跟踪·模板匹配
Python大数据分析@5 小时前
Python 语言有什么奇技淫巧吗?
开发语言·python·c#
励志不掉头发的内向程序员6 小时前
从零开始的python学习——列表
开发语言·python·学习
芒果量化7 小时前
redis - 远程发送买卖信号、本地接收信号处理
redis·python·金融
思辨共悟7 小时前
(Python)数据分析:概念和流程
python·数据分析