数据分析中的dataframe详解

DataFrame 是什么?一句话讲透

DataFrame 就是 Pandas 里的「表格」 ,和 Excel 表格、数据库表 完全一样,有行有列、有表头、有数据,是 Python 数据处理最核心的对象。

你可以把它理解成:

👉 带名字的表格版 NumPy 数组


一、最简单直观的样子(用你的数据)

你之前的正弦数据,变成 DataFrame 长这样:

x sin(x)
0.0 0.000000
0.1 0.099833
0.2 0.198669
... ...

二、怎么创建 DataFrame(最常用)

python 复制代码
import numpy as np
import pandas as pd

# 你的数据
x = np.linspace(0, 10, 100)
y = np.sin(x)

# 👉 把数组变成表格(DataFrame)
df = pd.DataFrame({
    "x坐标": x,     # 列名1
    "正弦值": y     # 列名2
})

三、DataFrame 最常用操作(必须会)

1)看前5行

python 复制代码
df.head()

2)取一列(像字典一样)

python 复制代码
df["正弦值"]   # 拿到一整列

3)查看基本信息(行、列、数据类型)

python 复制代码
df.info()

4)统计(平均值、最大值等)

python 复制代码
df.describe()

5)筛选数据

python 复制代码
# 筛选正弦值大于 0 的行
df[df["正弦值"] > 0]

四、为什么 Altair / Streamlit 必须用 DataFrame?

因为:

  • NumPy 数组只有数字,没有列名
  • Altair 画图需要知道:横轴是什么、纵轴是什么
  • DataFrame 自带列名,所以最适合做可视化
python 复制代码
# Altair 必须用 DataFrame
alt.Chart(df).mark_line().encode(
    x="x坐标",
    y="正弦值"
)

五、一句话总结核心

  • DataFrame = 表格
  • 列名 + 数据组成
  • 基于 NumPy 构建
  • 是数据处理 + 可视化的标准格式
相关推荐
echome8882 小时前
Python 装饰器详解:从入门到实战
开发语言·python
攻城狮7号2 小时前
破解工业物联网数据分析困局:DolphinDB 核心解决方案探索
物联网·数据分析·时序数据库·dolphindb
罗罗攀2 小时前
PyTorch学习笔记|张量的索引分片、合并和维度调整
人工智能·pytorch·笔记·python·学习
洛兮银儿2 小时前
爬虫,如何查找一个网页的header请求头?
python
add45a2 小时前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python
Pyeako2 小时前
大模型--OpenAI&创建阿里云百炼API Key
python·阿里云·大模型·云计算·openai·qwen·api key
m0_743297422 小时前
实战:用OpenCV和Python进行人脸识别
jvm·数据库·python
XW01059992 小时前
5-11字典合并
数据结构·python·算法