第14天:实际应用------pandas 进阶(筛选与保存)
学习内容:pandas 进阶
核心知识点:数据筛选与结果保存
当日目标:筛选及导出
练习任务:筛选特定分数并保存
- 为什么要学数据筛选?(逻辑拆解)
(1)核心思想:从成千上万行数据中,瞬间抓出你关心的那一部分。
(2)逻辑类比:
* Excel:你需要点"漏斗"图标,然后勾选条件。
* pandas:你写一行简单的判断语句(比如"分数 > 90"),它就会把符合条件的行像"过滤网"一样留下来。
- 如何筛选并保存数据?
(1)核心思想:先"选"出来,再"写"成新文件。
(2)电脑做法:
* 筛选:df[df['列名'] > 某个值]。
* 保存:.to_csv('新文件名.csv')。
- 今日练习代码实现
import pandas as pd# 初始化:导入 pandas 工具包,并简写成 pd
1. 读取数据
df = pd.read_csv('data.csv')
2. 输出前 5 行与行列数
print("---以下是数据的前 5 行---")
print(df.head())
print("---数据的行列数---")
print(df.shape)
3. 进阶计算
avg_score = df['score'].mean()
max_score = df['score'].max()
print(f"表格中的平均分是:{avg_score}")
print(f"表格中的最高分是:{max_score}")
4. 数据筛选
high_scores = df[df['score'] > 90]
print("---以下是超过 90 分的学生---")
print(high_scores)
5. 结果保存
high_scores.to_csv('high_scores_report.csv', index=False)
print("---完毕!---")

