12. NumPy 数据分析与图像处理入门

NumPy 数据分析与图像处理入门

NumPy 不仅是科学计算和线性代数的重要工具,也是 数据分析与图像处理 的基础。依托其高效的数组操作、向量化计算和广播机制,我们能够快速处理表格数据、时间序列以及图像像素矩阵。本篇作为系列的收官篇,将展示 NumPy 在数据分析和图像处理中的实际应用。

本文将围绕以下几个方面展开:

  1. NumPy 在数据分析中的常见应用
  2. 数据分析示例
  3. 图像处理的基本概念与数组表示
  4. 图像操作与增强实例

1. NumPy 在数据分析中的应用

在数据分析工作中,NumPy 是 Pandas、Matplotlib、Scikit-learn 等工具的底层支撑,常见用途包括:

  • 数据清洗与预处理:筛选、缺失值处理
  • 统计计算:均值、方差、分位数
  • 大规模计算:借助向量化与广播提升效率
  • 数据变换:标准化、归一化等

NumPy 的数组机制让复杂的数据处理更加简洁高效。


2. 简单数据分析示例

假设我们有一个学生成绩数组:

python 复制代码
import numpy as np

scores = np.array([[90, 85, 70],
                   [75, 80, 85],
                   [60, 70, 65],
                   [95, 90, 100]])

# 每位学生的平均成绩
student_avg = np.mean(scores, axis=1)
print("学生平均成绩:", student_avg)

# 每门课程的平均成绩
course_avg = np.mean(scores, axis=0)
print("课程平均成绩:", course_avg)

# 标准化处理
scores_std = (scores - course_avg) / np.std(scores, axis=0)
print("标准化后的成绩:\n", scores_std)

学生平均成绩: [81.66666667 80. 65. 95. ]

课程平均成绩: [80. 81.25 80. ]

标准化后的成绩:

\[ 0.73029674 0.50709255 -0.73029674

-0.36514837 -0.16903085 0.36514837

-1.46059349 -1.52127766 -1.09544512

1.09544512 1.18321596 1.46059349\]

这里,借助 NumPy 的统计函数和广播机制,我们能够轻松完成逐行、逐列运算,并实现标准化处理。


3. NumPy 在图像处理中的基础操作

图像本质上是一个多维数组:

  • 灰度图像:二维数组(高度 × 宽度)
  • 彩色图像:三维数组(高度 × 宽度 × 颜色通道)

常见操作包括:

  1. 读取和转换图像为数组
  2. 数组操作修改像素值
  3. 图像裁剪、旋转、翻转
python 复制代码
from skimage import data
import matplotlib.pyplot as plt

# 读取示例图片
img = data.astronaut()  # 彩色图像
print("图像形状:", img.shape)

# 显示原图
plt.imshow(img)
plt.axis("off")
plt.show()

图像形状: (512, 512, 3)


4. 图像处理示例

4.1 灰度化

python 复制代码
# 灰度化: RGB 加权平均
gray = img.mean(axis=2)
plt.imshow(gray, cmap='gray')
plt.show()

4.2 翻转

python 复制代码
# 垂直翻转
flip_vertical = img[::-1, :, :]
plt.imshow(flip_vertical)
plt.show()

4.3 裁剪

python 复制代码
# 裁剪中心区域
h, w = img.shape[:2]
crop = img[h//4:3*h//4, w//4:3*w//4, :]
plt.imshow(crop)
plt.show()

4.4 简单图像增强

python 复制代码
# 提高亮度
bright = np.clip(img + 50, 0, 255)  # 限制像素值在 [0,255]
plt.imshow(bright)
plt.show()
  • NumPy 数组操作可以直接修改像素矩阵,无需循环
  • 与 Matplotlib、OpenCV 等库结合,可完成高级图像处理

5. 小结与系列回顾

在本篇文章中,我们展示了 NumPy 在 数据分析和图像处理 中的应用,包括:

  • 借助向量化和广播机制实现高效数组运算
  • 快速完成均值、方差、标准化等统计分析
  • 将图像视作数组,轻松完成裁剪、翻转、增强等处理
  • 与 Pandas、Matplotlib、Scikit-learn、OpenCV 等工具无缝衔接

至此,我们完成了 NumPy 系列教程(共 12 篇)。从环境安装、数组基础、数学与统计函数、随机数生成、线性代数与广播机制,到高效数据处理与图像处理,我们系统地掌握了 NumPy 的核心功能与实际应用。这套知识体系将为你进一步学习数据科学、机器学习和计算机视觉奠定坚实的基础。

learn、OpenCV 等工具无缝衔接

至此,我们完成了 NumPy 系列教程(共 12 篇)。从环境安装、数组基础、数学与统计函数、随机数生成、线性代数与广播机制,到高效数据处理与图像处理,我们系统地掌握了 NumPy 的核心功能与实际应用。这套知识体系将为你进一步学习数据科学、机器学习和计算机视觉奠定坚实的基础。


上一篇:11. NumPy 高效数据处理与优化

相关推荐
新知图书27 分钟前
Power BI Desktop连接数据源
信息可视化·数据分析·power bi·商务数据分析·商业数据分析
心静财富之门29 分钟前
Flask 详细讲解 + 实战实例(零基础可学)
后端·python·flask
B博士32 分钟前
科研进展 | JAG: 大光斑高光谱激光雷达遥感辐射传输模型从垂直视角解锁森林叶绿素分布密码
人工智能·jag·高光谱激光雷达·森林分层叶绿素诊断
架构师老Y36 分钟前
003、Python Web框架深度对比:Django vs Flask vs FastAPI
前端·python·django
Yao.Li1 小时前
PVN3D ORT CUDA Custom Ops 实现与联调记录
人工智能·3d·具身智能
诺伦1 小时前
LocalClaw 在智能制造的新机会:6部门AI+电商政策下的工厂AI升级方案
人工智能·制造
疯狂成瘾者2 小时前
语义分块提升RAG检索精度
python
小陈工3 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
A__tao8 小时前
Elasticsearch Mapping 一键生成 Java 实体类(支持嵌套 + 自动过滤注释)
java·python·elasticsearch
墨染天姬8 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能