数据分析中的dataframe详解

DataFrame 是什么?一句话讲透

DataFrame 就是 Pandas 里的「表格」 ,和 Excel 表格、数据库表 完全一样,有行有列、有表头、有数据,是 Python 数据处理最核心的对象。

你可以把它理解成:

👉 带名字的表格版 NumPy 数组


一、最简单直观的样子(用你的数据)

你之前的正弦数据,变成 DataFrame 长这样:

x sin(x)
0.0 0.000000
0.1 0.099833
0.2 0.198669
... ...

二、怎么创建 DataFrame(最常用)

python 复制代码
import numpy as np
import pandas as pd

# 你的数据
x = np.linspace(0, 10, 100)
y = np.sin(x)

# 👉 把数组变成表格(DataFrame)
df = pd.DataFrame({
    "x坐标": x,     # 列名1
    "正弦值": y     # 列名2
})

三、DataFrame 最常用操作(必须会)

1)看前5行

python 复制代码
df.head()

2)取一列(像字典一样)

python 复制代码
df["正弦值"]   # 拿到一整列

3)查看基本信息(行、列、数据类型)

python 复制代码
df.info()

4)统计(平均值、最大值等)

python 复制代码
df.describe()

5)筛选数据

python 复制代码
# 筛选正弦值大于 0 的行
df[df["正弦值"] > 0]

四、为什么 Altair / Streamlit 必须用 DataFrame?

因为:

  • NumPy 数组只有数字,没有列名
  • Altair 画图需要知道:横轴是什么、纵轴是什么
  • DataFrame 自带列名,所以最适合做可视化
python 复制代码
# Altair 必须用 DataFrame
alt.Chart(df).mark_line().encode(
    x="x坐标",
    y="正弦值"
)

五、一句话总结核心

  • DataFrame = 表格
  • 列名 + 数据组成
  • 基于 NumPy 构建
  • 是数据处理 + 可视化的标准格式
相关推荐
xiaoshuaishuai816 小时前
Git二分法定位Bug
开发语言·python
2401_8357925416 小时前
FastAPI 速通
windows·python·fastapi
YMWM_17 小时前
export MPLBACKEND=Agg命令使用
linux·python
派大星~课堂17 小时前
【力扣-148. 排序链表】Python笔记
python·leetcode·链表
微涼53017 小时前
【Python】在使用联网工具时需要的问题
服务器·python·php
小白菜又菜17 小时前
Leetcode 657. Robot Return to Origin
python·leetcode·职场和发展
2402_8813193018 小时前
跨服务通信兜底机制-Java 回传失败无持久重试队列,报告可能静默丢失。
java·开发语言·python
自信不孤单19 小时前
UniAda核心代码详解
python·ai·大模型·tta·狄利克雷理论·证据感知
smj2302_7968265219 小时前
解决leetcode第3883题统计满足数位和数组的非递减数组数目
python·算法·leetcode
李昊哲小课19 小时前
Python办公自动化教程 - openpyxl让Excel处理变得轻松
python·信息可视化·excel