图像预处理(基础功能)

OpenCV

读取图像:

python 复制代码
img = cv2.imread(文件名,[显示控制参数])  #读取图像
cv2.imread(filename, flags=cv2.IMREAD_COLOR)
filename: str

描述: 需要读取的图像文件的路径和文件名。

类型: 字符串。

flags: int (可选)

描述: 图像的读取模式。这个参数决定了图像如何被读入:

cv2.IMREAD_COLOR 或 1: 读取彩色图像(默认值)。图像将被读入为一个三通道的 BGR 图像。

cv2.IMREAD_GRAYSCALE 或 0: 读取灰度图像。图像将被读入为一个单通道的灰度图像。

cv2.IMREAD_UNCHANGED 或 -1: 读取图像及其 alpha 通道(如果存在)。图像将被读入为一个包括所有##通道的图像(通常为 BGRA)。*/

调整大小

python 复制代码
cv2.resize(src, dsize, fx=0, fy=0, interpolation=cv2.INTER_LINEAR)
参数说明:
  1. src : ndarray

    • 描述: 要调整大小的输入图像。
    • 类型: 图像数据。
  2. dsize : tuple

    • 描述 : 输出图像的尺寸 (宽度, 高度)
    • 类型: 元组。
  3. fx : float (可选)

    • 描述 : 水平缩放因子。如果 dsize 被指定,这个参数可以忽略。
    • 类型: 浮点数。
  4. fy : float (可选)

    • 描述 : 垂直缩放因子。如果 dsize 被指定,这个参数可以忽略。
    • 类型: 浮点数。
  5. interpolation : int (可选)

    • 描述 : 插值方法。用于图像大小调整的插值算法。常用选项包括:
      • cv2.INTER_LINEAR: 双线性插值(默认值)。
      • cv2.INTER_NEAREST: 最近邻插值。
      • cv2.INTER_CUBIC: 三次插值。
      • cv2.INTER_LANCZOS4: Lanczos 插值。

展示图片

python 复制代码
cv2.imshow(窗口名,图像名)           #显示图像
#示例
cv2.imshow(demo,img)
cv2.waitKey(2000)       #显示时间2000ms
cv2.destroyAllWindows()#清除所有窗口


#图像保存
cv2.imwrite(文件地址,文件名)
cv2.imwrite("/home/test.jpg",img)
  1. 读取图片 :使用 cv2.imread() 函数读取图像。
  2. 显示图片 :使用 cv2.imshow() 函数显示读取的图像。
  3. 等待用户按键 :使用 cv2.waitKey() 函数等待用户的按键输入。如果参数为0,则无限等待,直到用户按下某个键。
  4. 关闭窗口 :使用 cv2.destroyAllWindows() 函数关闭所有打开的窗口。

PIL

打开和保存

python 复制代码
from PIL import Image

# 打开图像
img = Image.open("example.jpg")

# 保存图像
img.save("example_copy.png")

裁剪缩放旋转翻转

python 复制代码
# 裁剪图像
left = 100
top = 100
right = 400
bottom = 400
cropped_img = img.crop((left, top, right, bottom))

# 调整图像大小
resized_img = img.resize((200, 200))

# 旋转图像
rotated_img = img.rotate(90)

# 水平翻转图像
flipped_img = img.transpose(Image.FLIP_LEFT_RIGHT)
resize
python 复制代码
from PIL import Image

# 打开图像文件
img = Image.open("example.jpg")

# 指定新的尺寸 (宽度, 高度)
new_size = (200, 200)

# 使用resize()方法调整图像大小
resized_img = img.resize(new_size)

# 保存调整后的图像
resized_img.save("resized_example.jpg")

# 显示调整后的图像
resized_img.show()

转换模式:如RGB、L mode(灰度图像)等

python 复制代码
# 转换为灰度图像
gray_img = img.convert("L")

# 转换为RGBA图像(带透明度)
rgba_img = img.convert("RGBA")
相关推荐
谁似人间西林客6 分钟前
汽车智能制造解决方案:如何通过智能仓储物流降本提效?
人工智能·汽车·制造
jiushiapwojdap18 分钟前
Antigravity Awesome Skills:1527+ AI 编程助手的可安装技能库
人工智能·其他
顾北顾20 分钟前
多头注意力机制
人工智能·深度学习·算法
hujinyuan2016035 分钟前
2025年12月中国电子学会青少年机器人技术等级考试试卷(二级) 真题+答案
人工智能·算法·机器人
码农小白AI41 分钟前
采购合同与来料证书对标校验,IACheck联动AI报告审核通审Agent版自动识别指标不符单据
人工智能
元岳数字人小元1 小时前
AI 数字人开发公司浅谈 虚拟数字人打造景区新服务
人工智能·人机交互·交互
哦哦~9211 小时前
AI赋能生物医学:从临床数据到药物分子性质预测实战培
人工智能·生物医学·药物分子
GIS数据转换器1 小时前
城市排水生命线安全运行监测平台深度解析
java·运维·人工智能·python·安全·数据挖掘·无人机
虫无涯1 小时前
本地离线大模型实战:Ollama + Llama 3.1 8B 全流程部署(适配VSCode Continue代码助手)
人工智能
Rocky Ding*2 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native