DataFrame 是什么?一句话讲透
DataFrame 就是 Pandas 里的「表格」 ,和 Excel 表格、数据库表 完全一样,有行有列、有表头、有数据,是 Python 数据处理最核心的对象。
你可以把它理解成:
👉 带名字的表格版 NumPy 数组
一、最简单直观的样子(用你的数据)
你之前的正弦数据,变成 DataFrame 长这样:
| x | sin(x) |
|---|---|
| 0.0 | 0.000000 |
| 0.1 | 0.099833 |
| 0.2 | 0.198669 |
| ... | ... |
二、怎么创建 DataFrame(最常用)
python
import numpy as np
import pandas as pd
# 你的数据
x = np.linspace(0, 10, 100)
y = np.sin(x)
# 👉 把数组变成表格(DataFrame)
df = pd.DataFrame({
"x坐标": x, # 列名1
"正弦值": y # 列名2
})
三、DataFrame 最常用操作(必须会)
1)看前5行
python
df.head()
2)取一列(像字典一样)
python
df["正弦值"] # 拿到一整列
3)查看基本信息(行、列、数据类型)
python
df.info()
4)统计(平均值、最大值等)
python
df.describe()
5)筛选数据
python
# 筛选正弦值大于 0 的行
df[df["正弦值"] > 0]
四、为什么 Altair / Streamlit 必须用 DataFrame?
因为:
- NumPy 数组只有数字,没有列名
- Altair 画图需要知道:横轴是什么、纵轴是什么
- DataFrame 自带列名,所以最适合做可视化
python
# Altair 必须用 DataFrame
alt.Chart(df).mark_line().encode(
x="x坐标",
y="正弦值"
)
五、一句话总结核心
- DataFrame = 表格
- 由列名 + 数据组成
- 基于 NumPy 构建
- 是数据处理 + 可视化的标准格式