Python 数据分析三大库:NumPy + Pandas + Matplotlib

一、整体定位

  • NumPy :数值计算底层,数组、矩阵、数学运算,是 Pandas 和 Matplotlib 的基础
  • Pandas表格数据分析,处理 Excel/CSV、清洗、筛选、统计、分组
  • Matplotlib数据可视化,画折线、柱状、饼图、直方图等

一、NumPy 核心

作用

高效处理同类型数值数组,运算比原生列表快几十倍,适合矩阵、数值计算。

常用功能

  1. 创建数组

python

运行

复制代码
import numpy as np

arr = np.array([1,2,3,4])
# 全0、全1、等差数组
np.zeros(5)
np.ones((2,3))
np.linspace(1,10,5)
  1. 数组属性
  • 形状:arr.shape
  • 维度:arr.ndim
  • 类型:arr.dtype
  1. 切片、矩阵运算、广播机制
  2. 常用统计:np.mean() 均值、np.sum() 求和、np.max() 最大值、np.min() 最小值

二、Pandas 核心(数据分析主力)

两大核心结构:

  • Series:一维带索引数组
  • DataFrame:二维表格(Excel 一样)

1. 读写数据

python

运行

复制代码
import pandas as pd

df = pd.read_csv("数据.csv")
# df = pd.read_excel("数据.xlsx")

2. 基础查看

python

运行

复制代码
df.head()      # 前5行
df.tail()      # 后5行
df.info()      # 结构、缺失值
df.describe()  # 统计摘要
df.columns     # 列名

3. 数据筛选

python

运行

复制代码
# 选列
df["姓名"]
# 条件筛选
df[df["成绩"] > 60]

4. 缺失值处理

python

运行

复制代码
df.dropna()    # 删除空值
df.fillna(0)   # 填充空值

5. 分组聚合

python

运行

复制代码
# 按班级分组求平均分
df.groupby("班级")["成绩"].mean()

6. 新增列、排序、去重

python

运行

复制代码
df["总分"] = df["语文"] + df["数学"]
df.sort_values("成绩",ascending=False)
df.drop_duplicates()

三、Matplotlib 核心(画图)

基础导入

python

运行

复制代码
import matplotlib.pyplot as plt

常用图表

  1. 折线图:趋势变化

python

运行

复制代码
x = [1,2,3,4]
y = [10,20,15,30]
plt.plot(x,y)
plt.show()
  1. 柱状图:对比大小

python

运行

复制代码
plt.bar(x,y)
plt.show()
  1. 饼图:占比

python

运行

复制代码
plt.pie(y,labels=x)
plt.show()
  1. 直方图:数据分布

python

运行

复制代码
plt.hist(y)
plt.show()

通用配置

python

运行

复制代码
plt.title("标题")
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.legend()   # 图例
plt.grid()     # 网格

四、三者关系一句话

  1. NumPy 提供底层数值数组
  2. Pandas 基于 NumPy 做表格数据处理
  3. Matplotlib 把 Pandas/NumPy 数据可视化出图
相关推荐
KaMeidebaby2 分钟前
卡梅德生物技术快报|原核表达系统工艺优化:包涵体重折叠 + 分子筛纯化实现功能 RBD 高效制备,附全参数配置
前端·人工智能·算法·数据挖掘·数据分析
唐装鼠25 分钟前
Nginx + Gunicorn + Python Web 应用 架构(Claude)
python·nginx·gunicorn
梦想三三30 分钟前
【PYthon词频统计与文本向量化】苏宁易购评论分析实战
开发语言·python
biter down1 小时前
9:JSONSchema
python
日晨难再1 小时前
C语言&Python&Bash&Tcl:全局变量和局部变量
c语言·python·bash·tcl
麻雀飞吧1 小时前
期货量化主连和具体合约怎么切:天勤 KQ.m 与 KQ.i 用法
python·区块链
先吃饱再说2 小时前
Python List 切片与 LLM Prompt 设计:从数据结构到接口调用
python
一只专注api接口开发的技术猿2 小时前
OpenClaw 对接淘宝商品 API,低成本实现全天候选品监控|附可运行 Python 实操代码
大数据·开发语言·数据库·python
xingpanvip2 小时前
星盘接口开发文档:马盘次限盘接口指南
android·开发语言·python·php·lua
FBI HackerHarry浩2 小时前
第二阶段Day07【Python生成器、yield关键字、property、正则表达式】
开发语言·python·正则表达式