【PyTorch】【机器学习】图片张量、通道分解&合成和裁剪

一、导入所需库

python 复制代码
from PIL import Image
import torch
import numpy as np
import matplotlib.pyplot as plt

二、读取图片

python 复制代码
pic = np.array(Image.open('venice-boat.jpg'))

上述代码解释:先用Image.open()方法读取jpg格式图片,再用np.array()方法将图片转成numpy数组(ndarray)格式。

三、建立张量

图片在PyTorch中以3维张量表示。以下代码将图片转换成张量形式:

python 复制代码
pic_tensor = torch.from_numpy(pic)

打印张量数据内容:

python 复制代码
print(pic_tensor)

输出:

python 复制代码
tensor([[[ 47, 138, 221],  # 每个像素点的RGB颜色值
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 89, 149, 221],
         [ 87, 150, 221],
         [ 86, 149, 220]],

        [[ 47, 138, 221],
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 88, 148, 220],
         [ 85, 148, 219],
         [ 85, 148, 219]],

        [[ 47, 138, 221],
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 84, 147, 218],
         [ 84, 147, 218],
         [ 83, 146, 217]],

        ...,

四、通过张量对图片进行操作

(注:在以下的各个操作下,还需要用plt.show()语句才能将图片输出到屏幕上。)

1、打印整张图片

python 复制代码
plt.imshow(pic)

2、分RGB通道打印图片

输出通道1:
python 复制代码
plt.imshow(pic_tensor[:, :, 0].numpy())
输出通道2:
python 复制代码
plt.imshow(pic_tensor[:, :, 1].numpy())
输出通道3:
python 复制代码
plt.imshow(pic_tensor[:, :, 2].numpy())


注意: 三通道并不是简单的算术叠加,例如以下代码的输出和原图大相径庭:

python 复制代码
from PIL import Image
import torch
import numpy as np
import matplotlib.pyplot as plt


pic_1 = np.array(Image.open('Channel_1.jpg'))
pic_2 = np.array(Image.open('Channel_2.jpg'))
pic_3 = np.array(Image.open('Channel_3.jpg'))

pic_tensor_1 = torch.from_numpy(pic_1)
pic_tensor_2 = torch.from_numpy(pic_2)
pic_tensor_3 = torch.from_numpy(pic_3)

pic_tensor = pic_tensor_1 + pic_tensor_2 + pic_tensor_3
plt.imshow(pic_tensor.numpy())

plt.show()

输出图片:

3、裁剪图片

对图片张量的裁剪在其前2个维度上进行(第3个维度为颜色通道),示例代码如下:

python 复制代码
plt.imshow(pic_tensor[50: 1050, 400: 800, :].numpy())

裁剪结果:

相关推荐
测试_AI_一辰几秒前
AI系统到底怎么测?一套六层测试框架(Agent案例)
人工智能·功能测试·需求分析·ai编程
运维小欣2 分钟前
智能体选型实战指南
运维·人工智能
小超同学你好6 分钟前
LangGraph 14. MCP:把“外部能力”标准化接入 LLM
人工智能·语言模型·transformer
_张一凡1 小时前
【多模态模型学习】从零手撕一个Vision Transformer(ViT)模型实战篇
人工智能·深度学习·transformer
Westward-sun.1 小时前
OpenCV 实战:银行卡号识别系统(基于模板匹配)
人工智能·opencv·计算机视觉
网安INF1 小时前
【论文阅读】-《TtBA: Two-third Bridge Approach for Decision-Based Adversarial Attack》
论文阅读·人工智能·神经网络·对抗攻击
努力也学不会java1 小时前
【缓存算法】一篇文章带你彻底搞懂面试高频题LRU/LFU
java·数据结构·人工智能·算法·缓存·面试
BPM6662 小时前
2026流程管理软件选型指南:从Workflow、BPM到AI流程平台(架构+实战)
人工智能·架构
金融小师妹2 小时前
基于多模态宏观建模与历史序列对齐:原油能源供给冲击的“类1970年代”演化路径与全球应对机制再评估
大数据·人工智能·能源
JamesYoung79712 小时前
OpenClaw小龙虾如何系统性节省Token,有没有可落地的方案?
人工智能