数据分析中的dataframe详解

DataFrame 是什么?一句话讲透

DataFrame 就是 Pandas 里的「表格」 ,和 Excel 表格、数据库表 完全一样,有行有列、有表头、有数据,是 Python 数据处理最核心的对象。

你可以把它理解成:

👉 带名字的表格版 NumPy 数组


一、最简单直观的样子(用你的数据)

你之前的正弦数据,变成 DataFrame 长这样:

x sin(x)
0.0 0.000000
0.1 0.099833
0.2 0.198669
... ...

二、怎么创建 DataFrame(最常用)

python 复制代码
import numpy as np
import pandas as pd

# 你的数据
x = np.linspace(0, 10, 100)
y = np.sin(x)

# 👉 把数组变成表格(DataFrame)
df = pd.DataFrame({
    "x坐标": x,     # 列名1
    "正弦值": y     # 列名2
})

三、DataFrame 最常用操作(必须会)

1)看前5行

python 复制代码
df.head()

2)取一列(像字典一样)

python 复制代码
df["正弦值"]   # 拿到一整列

3)查看基本信息(行、列、数据类型)

python 复制代码
df.info()

4)统计(平均值、最大值等)

python 复制代码
df.describe()

5)筛选数据

python 复制代码
# 筛选正弦值大于 0 的行
df[df["正弦值"] > 0]

四、为什么 Altair / Streamlit 必须用 DataFrame?

因为:

  • NumPy 数组只有数字,没有列名
  • Altair 画图需要知道:横轴是什么、纵轴是什么
  • DataFrame 自带列名,所以最适合做可视化
python 复制代码
# Altair 必须用 DataFrame
alt.Chart(df).mark_line().encode(
    x="x坐标",
    y="正弦值"
)

五、一句话总结核心

  • DataFrame = 表格
  • 列名 + 数据组成
  • 基于 NumPy 构建
  • 是数据处理 + 可视化的标准格式
相关推荐
wj3055853782 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
星寂樱易李3 小时前
iperf3 + Python-- 网络带宽、网速、网络稳定性
开发语言·网络·python
qingfeng154153 小时前
企业微信机器人开发:如何实现自动化与智能运营?
人工智能·python·机器人·自动化·企业微信
彦为君6 小时前
Agent 安全:从权限提示到沙箱隔离
python·ai·ai编程
PILIPALAPENG7 小时前
Python 语法速成指南:前端开发者视角(JS 类比版)
前端·人工智能·python
用户8356290780518 小时前
Python 操作 PowerPoint 页眉与页脚指南
后端·python
枫叶林FYL8 小时前
项目九:异步高性能爬虫与数据采集中枢 —— 基于 Crawl<sub>4</sub>AI 与 Playwright 的现代化数据采集平台 项目总览
爬虫·python·深度学习·wpf
猫猫的小茶馆9 小时前
【Python】函数与模块化编程
linux·开发语言·arm开发·驱动开发·python·stm32
Miss_min9 小时前
128K长序列数据生成
开发语言·python·深度学习