数据分析中的dataframe详解

DataFrame 是什么?一句话讲透

DataFrame 就是 Pandas 里的「表格」 ,和 Excel 表格、数据库表 完全一样,有行有列、有表头、有数据,是 Python 数据处理最核心的对象。

你可以把它理解成:

👉 带名字的表格版 NumPy 数组


一、最简单直观的样子(用你的数据)

你之前的正弦数据,变成 DataFrame 长这样:

x sin(x)
0.0 0.000000
0.1 0.099833
0.2 0.198669
... ...

二、怎么创建 DataFrame(最常用)

python 复制代码
import numpy as np
import pandas as pd

# 你的数据
x = np.linspace(0, 10, 100)
y = np.sin(x)

# 👉 把数组变成表格(DataFrame)
df = pd.DataFrame({
    "x坐标": x,     # 列名1
    "正弦值": y     # 列名2
})

三、DataFrame 最常用操作(必须会)

1)看前5行

python 复制代码
df.head()

2)取一列(像字典一样)

python 复制代码
df["正弦值"]   # 拿到一整列

3)查看基本信息(行、列、数据类型)

python 复制代码
df.info()

4)统计(平均值、最大值等)

python 复制代码
df.describe()

5)筛选数据

python 复制代码
# 筛选正弦值大于 0 的行
df[df["正弦值"] > 0]

四、为什么 Altair / Streamlit 必须用 DataFrame?

因为:

  • NumPy 数组只有数字,没有列名
  • Altair 画图需要知道:横轴是什么、纵轴是什么
  • DataFrame 自带列名,所以最适合做可视化
python 复制代码
# Altair 必须用 DataFrame
alt.Chart(df).mark_line().encode(
    x="x坐标",
    y="正弦值"
)

五、一句话总结核心

  • DataFrame = 表格
  • 列名 + 数据组成
  • 基于 NumPy 构建
  • 是数据处理 + 可视化的标准格式
相关推荐
用户83562907805111 小时前
Python 实现 PDF 文件加密与解密方法
后端·python
用户83562907805111 小时前
使用 Python 冻结与拆分 Excel 窗格教程
后端·python
Databend13 小时前
2KB histogram 背后:Databend 如何低成本追踪长尾延迟
大数据·数据分析·agent
Aloudata技术团队15 小时前
正当红的 Context Layer 到底是什么?
数据分析
你好潘先生19 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
Agent_大师20 小时前
WebSocket 行情重连成功,K线缺口不会自动消失
python
荣码20 小时前
LLM结构化输出:让AI返回JSON而不是废话,我踩了4个坑
java·python
copyer_xyf20 小时前
FastAPI 如何连接 MySQL
后端·python
apocelipes1 天前
常用编程语言和库的正则表达式性能对比
c语言·c++·python·性能优化·golang·开发工具和环境
用户8356290780511 天前
使用 Python 在 PDF 中创建与管理书签
后端·python