图像预处理(基础功能)

OpenCV

读取图像:

python 复制代码
img = cv2.imread(文件名,[显示控制参数])  #读取图像
cv2.imread(filename, flags=cv2.IMREAD_COLOR)
filename: str

描述: 需要读取的图像文件的路径和文件名。

类型: 字符串。

flags: int (可选)

描述: 图像的读取模式。这个参数决定了图像如何被读入:

cv2.IMREAD_COLOR 或 1: 读取彩色图像(默认值)。图像将被读入为一个三通道的 BGR 图像。

cv2.IMREAD_GRAYSCALE 或 0: 读取灰度图像。图像将被读入为一个单通道的灰度图像。

cv2.IMREAD_UNCHANGED 或 -1: 读取图像及其 alpha 通道(如果存在)。图像将被读入为一个包括所有##通道的图像(通常为 BGRA)。*/

调整大小

python 复制代码
cv2.resize(src, dsize, fx=0, fy=0, interpolation=cv2.INTER_LINEAR)
参数说明:
  1. src : ndarray

    • 描述: 要调整大小的输入图像。
    • 类型: 图像数据。
  2. dsize : tuple

    • 描述 : 输出图像的尺寸 (宽度, 高度)
    • 类型: 元组。
  3. fx : float (可选)

    • 描述 : 水平缩放因子。如果 dsize 被指定,这个参数可以忽略。
    • 类型: 浮点数。
  4. fy : float (可选)

    • 描述 : 垂直缩放因子。如果 dsize 被指定,这个参数可以忽略。
    • 类型: 浮点数。
  5. interpolation : int (可选)

    • 描述 : 插值方法。用于图像大小调整的插值算法。常用选项包括:
      • cv2.INTER_LINEAR: 双线性插值(默认值)。
      • cv2.INTER_NEAREST: 最近邻插值。
      • cv2.INTER_CUBIC: 三次插值。
      • cv2.INTER_LANCZOS4: Lanczos 插值。

展示图片

python 复制代码
cv2.imshow(窗口名,图像名)           #显示图像
#示例
cv2.imshow(demo,img)
cv2.waitKey(2000)       #显示时间2000ms
cv2.destroyAllWindows()#清除所有窗口


#图像保存
cv2.imwrite(文件地址,文件名)
cv2.imwrite("/home/test.jpg",img)
  1. 读取图片 :使用 cv2.imread() 函数读取图像。
  2. 显示图片 :使用 cv2.imshow() 函数显示读取的图像。
  3. 等待用户按键 :使用 cv2.waitKey() 函数等待用户的按键输入。如果参数为0,则无限等待,直到用户按下某个键。
  4. 关闭窗口 :使用 cv2.destroyAllWindows() 函数关闭所有打开的窗口。

PIL

打开和保存

python 复制代码
from PIL import Image

# 打开图像
img = Image.open("example.jpg")

# 保存图像
img.save("example_copy.png")

裁剪缩放旋转翻转

python 复制代码
# 裁剪图像
left = 100
top = 100
right = 400
bottom = 400
cropped_img = img.crop((left, top, right, bottom))

# 调整图像大小
resized_img = img.resize((200, 200))

# 旋转图像
rotated_img = img.rotate(90)

# 水平翻转图像
flipped_img = img.transpose(Image.FLIP_LEFT_RIGHT)
resize
python 复制代码
from PIL import Image

# 打开图像文件
img = Image.open("example.jpg")

# 指定新的尺寸 (宽度, 高度)
new_size = (200, 200)

# 使用resize()方法调整图像大小
resized_img = img.resize(new_size)

# 保存调整后的图像
resized_img.save("resized_example.jpg")

# 显示调整后的图像
resized_img.show()

转换模式:如RGB、L mode(灰度图像)等

python 复制代码
# 转换为灰度图像
gray_img = img.convert("L")

# 转换为RGBA图像(带透明度)
rgba_img = img.convert("RGBA")
相关推荐
机器之心18 分钟前
DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
人工智能·openai
金融小师妹25 分钟前
AI多因子模型解析:黄金涨势受阻与美联储9月降息政策预期重构
大数据·人工智能·算法
R-G-B32 分钟前
【P38 6】OpenCV Python——图片的运算(算术运算、逻辑运算)加法add、subtract减法、乘法multiply、除法divide
人工智能·python·opencv·图片的运算·图片加法add·图片subtract减法·图片乘法multiply
拖拖76541 分钟前
解读《Thyme: Think Beyond Images》——让大模型“写代码”思考图像
人工智能
双向331 小时前
模型量化大揭秘:INT8、INT4量化对推理速度和精度的影响测试
人工智能
lisuwen1161 小时前
GPT-5 上线风波深度复盘:从口碑两极到策略调整,OpenAI 的变与不变
大数据·人工智能·gpt·chatgpt
硅谷秋水1 小时前
在相机空间中落地动作:以观察为中心的视觉-语言-行动策略
机器学习·计算机视觉·语言模型·机器人
新智元1 小时前
16 岁天才少年炒掉马斯克,空降华尔街巨头!9 岁上大学,14 岁进 SpaceX
人工智能·openai
martinzh1 小时前
让AI学会"边做边想":ReAct的实战指南
人工智能
七超AI落地实操1 小时前
我用AI写Mermaid,差点被逼疯!一个连Gemini都搞不定的“史诗级”排错之旅
人工智能