还在用 Python 原生列表算平均?
今天 10 分钟,把 NumPy 磨成瑞士军刀🔪------
向量化 × 广播 × 花式索引 全套带走,代码直接复制跑通!
1️⃣ 安装 & 惯用别名(全球统一暗号)
bash
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
python
import numpy as np # 暗号 np.*
2️⃣ 基础对象:ndarray 🌟
python
a = np.array([1, 2, 3], dtype=np.int32) # 1-D
b = np.array([[1, 2], [3, 4]], dtype=float) # 2-D
| 属性 | 说明 | 示例 |
|---|---|---|
a.ndim |
维度 | 1 |
a.shape |
形状 | (3,) |
a.size |
元素总数 | 3 |
a.dtype |
数据类型 | int32 |
3️⃣ 高效创建函数:一行顶列表循环十条 🚀
python
np.zeros((3, 4)) # 全 0
np.ones((2, 3, 4)) # 全 1
np.full((2, 2), 7) # 全 7
np.eye(3) # 单位矩阵
np.arange(0, 10, 2) # [0 2 4 6 8]
np.linspace(0, 1, 5) # 等分 5 段
np.random.default_rng(42).random((2,3)) # 0-1 随机
4️⃣ 向量化计算:告别 Python 慢循环 🐌➡️⚡️
python
x = np.arange(1e6)
y = x**2 + 3*x - 1 # 百万级一次完成
性能对比:
python
import timeit
py_list = list(range(100000))
np_arr = np.arange(100000)
timeit.timeit(lambda: [i**2 for i in py_list], number=10)
# >>> 0.28 s
timeit.timeit(lambda: np_arr**2, number=10)
# >>> 0.007 s ← 40 倍提速
5️⃣ 广播机制:形状不同也能算!📻
python
a = np.array([[1], [2], [3]]) # 3×1
b = np.array([10, 20]) # 1×2
a + b # 3×2 结果
'''
[[11 21]
[12 22]
[13 23]]
'''
规则:末尾维度相等 or 1,即可自动扩展。
6️⃣ 花式索引:一键提取、赋值 💎
python
arr = np.arange(16).reshape(4,4)
# 取 2×2 块
arr[1:3, 1:3]
# 布尔 Mask
mask = arr % 3 == 0
arr[mask] # 所有 3 的倍数
arr[mask] = -1 # 批量改值
7️⃣ 常用统计: axis 参数玩明白 📊
python
c = np.array([[1, 2, 3],
[4, 5, 6]])
np.sum(c, axis=0) # 按列 [5 7 9]
np.sum(c, axis=1) # 按行 [ 6 15]
np.mean(c)
np.std(c, dtype=np.float64)
8️⃣ 线性代数秒杀:一行解方程 🧮
python
A = np.array([[3, 1], [1, 2]])
b = np.array([9, 8])
x = np.linalg.solve(A, b) # array([2., 3.])
其他:
np.dot · np.linalg.inv · np.linalg.eig · svd · det
9️⃣ 性能黑科技:einsum 求和 🌪️
python
# 矩阵乘法 C = AB
C = np.einsum('ik,kj->ij', A, B)
# 比裸 for 快 10-50 倍,比 np.dot 还省内存
🔟 易错点提醒 ⚠️
| 坑 | 错误示例 | 正确 |
|---|---|---|
| 原地改值 | a = a + 1 会新数组 |
想省内存 a += 1 |
| 维度不一致 | [1,2] + [[1],[2]] 直接报错 |
先 reshape / 广播 |
| 浮点比较 | np.where(x == 0.3) 可能失败 |
用 np.isclose |
🏁 一句话总结(背它!)
"NumPy = Python 列表的涡轮增压器"
向量化加速、广播塑形、花式索引、线性代数一行搞定!🏎️
