Matplotlib/Seaborn:数据可视化

一、先搞懂:Pandas 是什么?

Pandas = Python 里的 Excel / 数据库表格 用来做:

  • 读取 Excel / CSV / 数据库数据
  • 筛选、过滤、查找数据
  • 计算、统计、汇总
  • 清洗、去重、缺失值处理
  • 数据导出

两个核心概念

  1. DataFrame(DF):整张表格(多行多列)
  2. Series:单列数据

二、安装 + 导入

复制代码
pip install pandas

import pandas as pd

三、最常用 10 个操作(必背)

1. 创建表格

复制代码
data = {
    "姓名": ["小明", "小红", "小李"],
    "年龄": [20, 21, 19],
    "城市": ["北京", "上海", "广州"]
}

df = pd.DataFrame(data)

2. 查看数据

复制代码
df.head()      # 前5行
df.head(3)     # 前3行
df.info()      # 查看列类型、是否为空
df.describe()  # 自动统计(均值、最大最小等)

3. 读取文件

复制代码
# 读取 CSV
df = pd.read_csv("数据.csv")

# 读取 Excel(需要 pip install openpyxl)
df = pd.read_excel("数据.xlsx")

# 读取后直接查看
df.head()

4. 选择列

复制代码
df["姓名"]        # 单列
df[["姓名", "年龄"]] # 多列

5. 筛选行(最常用!)

复制代码
# 年龄大于20
df[df["年龄"] > 20]

# 城市等于北京
df[df["城市"] == "北京"]

# 多个条件
df[(df["年龄"]>19) & (df["城市"]=="北京")]

6. 新增 / 修改列

复制代码
df["性别"] = "男"          # 新增列,全部赋值男
df["年龄+1"] = df["年龄"] + 1  # 用计算结果生成列

7. 处理缺失值

复制代码
df.isnull().sum()    # 查看每列缺失数量
df.dropna()          # 删除有空值的行
df.fillna(0)         # 把空值填成0

8. 去重

复制代码
df.drop_duplicates()  # 去重

9. 排序

复制代码
df.sort_values("年龄", ascending=False)  # 降序

10. 保存文件

复制代码
df.to_csv("新数据.csv", index=False)
df.to_excel("新数据.xlsx", index=False)

四、最简单实战案例(复制就能跑)

复制代码
import pandas as pd

# 1. 创建数据
data = {
    "产品": ["鱼", "贝壳", "虾", "章鱼"],
    "来源": ["海洋", "海洋", "海洋", "海洋"],
    "价格": [20, 15, 18, 25]
}
df = pd.DataFrame(data)

# 2. 筛选海洋来源
df_haiyang = df[df["来源"] == "海洋"]

# 3. 打印结果
print(df_haiyang)
相关推荐
Databend8 小时前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
ClouGence2 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle
飞将2 天前
从零实现数据库(2)——HashIndex + IndexManager
数据库
Nturmoils2 天前
订单列表慢查询,先看 WHERE、ORDER BY 和 LIMIT
数据库
渣波3 天前
拒绝 SQL 焦虑!手把手带你用 NestJS + Prisma + DTO 写出“防弹”级后端代码
javascript·数据库·后端
倔强的石头_4 天前
KingbaseES 新版MySQL 兼容版体验:旧版迁移 + 功能实测
数据库
倔强的石头_7 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
冬奇Lab7 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
ClouGence8 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
无响应de神8 天前
三、用户与权限管理
数据库·mysql