Python 图像库向 Python 解释器添加了图像处理功能。
该库提供了广泛的文件格式支持、高效的内部表示和相当强大的图像处理功能。
核心图像库旨在快速访问以几种基本像素格式存储的数据。它应该为通用图像处理工具提供坚实的基础。
概述
Python 图像库将图像处理功能添加到 Python 解释器。
该库提供广泛的文件格式支持,高效的内部 表示,以及相当强大的图像处理能力。
核心图像库旨在快速访问存储在少数几个图像中的数据 基本像素格式。它应该为一般图像提供坚实的基础 加工工具。
让我们看一下这个库的一些可能的用途。
图像档案
Python 图像库是图像存档和批处理的理想选择 应用。您可以使用该库创建缩略图,在 文件格式、打印图像等。
当前版本可识别和读取大量格式。写 有意将支持限制在最常用的交换和 演示文稿格式。
图像显示
当前版本包括 Tk 和接口,以及可与 PythonWin 和其他 基于 Windows 的工具包。许多其他 GUI 工具包都带有某种 PIL 支持。
对于调试,还有一种方法可以将图像保存到 磁盘,并调用外部显示实用程序。
图像处理
该库包含基本的图像处理功能,包括点操作、使用一组内置卷积核进行滤波和颜色空间转换。
该库还支持调整图像大小、旋转和任意仿射变换。
有一种直方图方法允许您从图像中提取一些统计数据。这可用于自动对比度增强和全局统计分析。
使用 pip 安装 Pillow:
python3 -m pip install --upgrade pip
python3 -m pip install --upgrade Pillow
(可选)为 Pillow 安装 defusedxml 以读取 XMP 数据, 和 olefile 用于 Pillow 读取 FPX 和 MIC 图像:
python3 -m pip install --upgrade defusedxml olefile
一、适用于 Linux 的二进制文件 ManyLinux wheel 格式的版本。其中包括对所有人的支持 可选库,但 libimagequant 除外。Raqm 支持需要 FriBiDi 单独安装:
python3 -m pip install --upgrade pip
python3 -m pip install --upgrade Pillow
大多数主要的 Linux 发行版,包括 Fedora、Ubuntu 和 ArchLinux 在以前包含 PIL 的包装中也包括 Pillow,例如 .Debian 将其拆分为两个包,以及 .python-imaging``python3-pilpython3-pil.imagetk
二、提供适用于 macOS 的二进制文件 wheel 格式的版本。其中包括对所有可选的支持 除 libimagequant 之外的库。Raqm 支持需要 FriBiDi 单独安装:
python3 -m pip install --upgrade pip
python3 -m pip install --upgrade Pillow
虽然我们为 x86-64 和 arm64 提供二进制文件,但我们不提供 universal2 二进制文件。但是,将我们当前的二进制文件组合起来创建一个文件很简单:
python3 -m pip download --only-binary=:all: --platform macosx_10_10_x86_64 Pillow
python3 -m pip download --only-binary=:all: --platform macosx_11_0_arm64 Pillow
python3 -m pip install delocate
然后,使用下载的轮子的名称,使用 Python 将它们组合起来:
from delocate.fuse import fuse_wheels
fuse_wheels('Pillow-9.4.0-2-cp39-cp39-macosx_10_10_x86_64.whl', 'Pillow-9.4.0-cp39-cp39-macosx_11_0_arm64.whl', 'Pillow-9.4.0-cp39-cp39-macosx_11_0_universal2.whl')
三、Windows 提供 Pillow 二进制文件,为支持的矩阵编译 wheel 格式的 Python。其中包括 x86、x86-64 和 arm64 版本 (arm64 上的 Python 3.8 除外)。这些二进制文件包括支持 对于除 libimagequant 和 libxcb 之外的所有可选库。Raqm 支持 需要单独安装 FriBiDi:
python3 -m pip install --upgrade pip
python3 -m pip install --upgrade Pillow
要在 MSYS2 中安装 Pillow,请参阅Installation - Pillow (PIL Fork) 10.2.0 documentation
使用 Image 类
Python 图像库中最重要的类是类,在具有相同名称的模块中定义。 可以通过多种方式创建此类的实例;通过加载 文件中的图像、处理其他图像或从头开始创建图像。
要从文件加载图像,请使用函数 在模块中:
>>> from PIL import Image
>>> im = Image.open("hopper.ppm")
如果成功,此函数将返回一个对象。 现在,您可以使用实例属性来检查文件内容:
>>> print(im.format, im.size, im.mode)
PPM (512, 512) RGB
该属性标识 图像。如果图像不是从文件中读取的,则将其设置为"无"。尺寸 属性是一个包含宽度和高度(以像素为单位)的 2 元组。该属性定义 图像中的条带,以及像素类型和深度。常见的模式是"L" (亮度)表示灰度图像,"RGB"表示真彩色图像,"CMYK"表示 印前图像。
如果无法打开文件,则会引发异常。
一旦你有了类的实例,你就可以使用 此类定义的用于处理和操作图像的方法。为 例如,让我们显示刚刚加载的图像:
>>> im.show()
注意
标准版不是很 高效,因为它将图像保存到临时文件并调用实用程序 以显示图像。如果您没有安装适当的实用程序, 它甚至行不通。但是,当它确实工作时,它非常方便 调试和测试。
读取和写入图像
Python 图像库支持多种图像文件格式。自 从磁盘读取文件,使用模块中的函数。您不必知道打开的文件格式 文件。库根据 文件。
若要保存文件,请使用类的方法。保存文件时,名称变为 重要。除非指定格式,否则库将使用文件名 扩展名以发现要使用的文件存储格式。
将文件转换为JPEG
import os, sys
from PIL import Image
for infile in sys.argv[1:]:
f, e = os.path.splitext(infile)
outfile = f + ".jpg"
if infile != outfile:
try:
with Image.open(infile) as im:
im.save(outfile)
except OSError:
print("cannot convert", infile)
可以向显式指定文件格式的方法提供第二个参数。如果您使用非标准 扩展名,您必须始终以这种方式指定格式:
创建 JPEG 缩略图
import os, sys
from PIL import Image
size = (128, 128)
for infile in sys.argv[1:]:
outfile = os.path.splitext(infile)[0] + ".thumbnail"
if infile != outfile:
try:
with Image.open(infile) as im:
im.thumbnail(size)
im.save(outfile, "JPEG")
except OSError:
print("cannot create thumbnail for", infile)
需要注意的是,该库不会解码或加载栅格数据 除非真的必须这样做。打开文件时,文件头将读为 确定文件格式并提取模式、大小等内容 解码文件所需的属性,但文件的其余部分不是 直到以后才处理。
这意味着打开图像文件是一个快速的操作,它是独立的 文件大小和压缩类型。这里有一个简单的脚本,可以快速 标识一组图像文件:
识别图像文件
import sys
from PIL import Image
for infile in sys.argv[1:]:
try:
with Image.open(infile) as im:
print(infile, im.format, f"{im.size}x{im.mode}")
except OSError:
pass
剪切、粘贴和合并图像
该类包含允许您 操作图像中的区域。要从图像中提取子矩形, 使用该方法。
从图像复制子矩形
box = (100, 100, 400, 400)
region = im.crop(box)
该区域由 4 元组定义,其中坐标为(左、上、右、 更低)。Python 图像库使用坐标系,其中 (0, 0) 左上角。另请注意,坐标是指 像素,因此上面示例中的区域正好是 300x300 像素。
现在可以以某种方式处理该区域并粘贴回去。
处理子矩形并将其粘贴回去
region = region.transpose(Image.Transpose.ROTATE_180)
im.paste(region, box)
将区域粘贴回去时,区域的大小必须与给定区域匹配 完全。此外,该区域不能延伸到图像之外。但是, 原始图像和区域的模式不需要匹配。如果他们不这样做, 区域在粘贴之前会自动转换(有关详细信息,请参阅下面的颜色转换部分)。
下面是一个附加示例:
滚动图像
def roll(im, delta):
"""Roll an image sideways."""
xsize, ysize = im.size
delta = delta % xsize
if delta == 0:
return im
part1 = im.crop((0, 0, delta, ysize))
part2 = im.crop((delta, 0, xsize, ysize))
im.paste(part1, (xsize - delta, 0, xsize, ysize))
im.paste(part2, (0, 0, xsize - delta, ysize))
return im
或者,如果您想将两个图像合并为一个更宽的图像:
合并图像
def merge(im1, im2):
w = im1.size[0] + im2.size[0]
h = max(im1.size[1], im2.size[1])
im = Image.new("RGBA", (w, h))
im.paste(im1)
im.paste(im2, (im1.size[0], 0))
return im
对于更高级的技巧,粘贴方法也可以将透明度蒙版作为 一个可选参数。在此掩码中,值 255 表示粘贴的 图像在该位置是不透明的(也就是说,粘贴的图像应用作 是)。值 0 表示粘贴的图像是完全透明的。值 介于两者之间表示不同级别的透明度。例如,粘贴 RGBA 图像并将其用作蒙版将粘贴不透明部分 的图像,但不是其透明背景。
Python 图像库还允许您使用 多波段图像,例如 RGB 图像。split 方法创建一组 新影像,每个影像都包含来自原始多波段影像的一个波段。这 merge 函数采用一个模式和一个图像元组,并将它们组合成一个新的 图像。以下示例交换 RGB 图像的三个波段:
拆分和合并频带
r, g, b = im.split()
im = Image.merge("RGB", (b, g, r))
请注意,对于单波段图像,返回 图像本身。要使用单个色带,您可能需要转换 首先将图像设置为"RGB"。
几何变换
该类包含 和 图像。前者采用一个元组给出新的大小,后者采用的角度 度逆时针。
简单的几何变换
out = im.resize((128, 128))
out = im.rotate(45) # degrees counter-clockwise
若要以 90 度为步长旋转图像,可以使用该方法或该方法。后者也可用于 围绕图像的水平轴或垂直轴翻转图像。
转置图像
out = im.transpose(Image.Transpose.FLIP_LEFT_RIGHT)
out = im.transpose(Image.Transpose.FLIP_TOP_BOTTOM)
out = im.transpose(Image.Transpose.ROTATE_90)
out = im.transpose(Image.Transpose.ROTATE_180)
out = im.transpose(Image.Transpose.ROTATE_270)
transpose(ROTATE)
操作也可以与操作相同,前提是标志是 true,以提供对图像大小的相同更改。expand
通过该方法可以进行更一般的图像转换形式。
相对调整大小
除了在调整大小时计算新图像的大小外,您还可以 选择相对于给定大小调整大小。
from PIL import Image, ImageOps
size = (100, 150)
with Image.open("Tests/images/hopper.png") as im:
ImageOps.contain(im, size).save("imageops_contain.png")
ImageOps.cover(im, size).save("imageops_cover.png")
ImageOps.fit(im, size).save("imageops_fit.png")
ImageOps.pad(im, size, color="#f00").save("imageops_pad.png")
thumbnail() can also be used,
but will modify the image object in place
im.thumbnail(size)
im.save("imageops_thumbnail.png")
|-------|---------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------|
| | thumbnail() | contain() | 封面() | fit() | pad() |
| 给定尺寸 | (100, 150)
| (100, 150)
| (100, 150)
| (100, 150)
| (100, 150)
|
| 生成的图像 | | | | | |
| 结果大小 | 100×100
| 100×100
| 150×150
| 100×150
| 100×150
|
颜色变换
Python 图像库允许您在不同像素之间转换图像 使用该方法的表示。
在模式之间转换
from PIL import Image
with Image.open("hopper.ppm") as im:
im = im.convert("L")
该库支持每个支持的模式和"L"之间的转换 和"RGB"模式。要在其他模式之间进行转换,您可能需要使用 中间图像(通常为"RGB"图像)。
图像增强
Python 图像库提供了许多方法和模块,这些方法和模块可以 用于增强图像。
过滤 器
该模块包含许多预定义的 可与该方法一起使用的增强筛选器。
应用过滤器
from PIL import ImageFilter
out = im.filter(ImageFilter.DETAIL)
单点操作
该方法可用于平移像素 图像的值(例如图像对比度操作)。在大多数情况下,一个 需要一个参数的函数对象可以传递给此方法。每 像素根据该函数进行处理:
应用点变换
multiply each pixel by 1.2
out = im.point(lambda i: i * 1.2)
使用上述技术,您可以快速将任何简单的表达式应用于 图像。您还可以结合 和 方法来有选择地修改图像:
处理单个波段
split the image into individual bands
source = im.split()
R, G, B = 0, 1, 2
select regions where red is less than 100
mask = source[R].point(lambda i: i < 100 and 255)
process the green band
out = source[G].point(lambda i: i * 0.7)
paste the processed band back, but only where red was < 100
source[G].paste(out, None, mask)
build a new multiband image
im = Image.merge(im.mode, source)
请注意用于创建掩码的语法:
Python 仅在必要时计算逻辑表达式的部分 确定结果,并返回作为 表达。因此,如果上面的表达式为 false (0),则 Python 不会查看 第二个操作数,因此返回 0。否则,它将返回 255。
增强
对于更高级的图像增强,您可以使用模块中的类。从映像创建后,增强功能 对象可用于快速尝试不同的设置。
您可以通过这种方式调整对比度、亮度、色彩平衡和锐度。
增强图像
from PIL import ImageEnhance
enh = ImageEnhance.Contrast(im)
enh.enhance(1.3).show("30% more contrast")
图像序列
Python 图像库包含对图像序列的一些基本支持 (也称为动画格式)。支持的序列格式包括 FLI/FLC、 GIF 和一些实验性格式。TIFF 文件也可以包含多个 框架。
当您打开序列文件时,PIL 会自动加载 序列。您可以使用 seek 和 tell 方法在不同的 框架:
读取序列
from PIL import Image
with Image.open("animation.gif") as im:
im.seek(1) # skip to the second frame
try:
while 1:
im.seek(im.tell() + 1)
do something to im
except EOFError:
pass # end of sequence
如本示例所示,当 序列结束。
下面的类允许您使用 for 语句遍历序列:
使用 ImageSequence Iterator 类
from PIL import ImageSequence
for frame in ImageSequence.Iterator(im):
...do something to frame...
PostScript 打印
Python 图像库包括打印图像、文本和 PostScript 打印机上的图形。下面是一个简单的示例:
绘制 PostScript
from PIL import Image
from PIL import PSDraw
with Image.open("hopper.ppm") as im:
title = "hopper"
box = (1 * 72, 2 * 72, 7 * 72, 10 * 72) # in points
ps = PSDraw.PSDraw() # default is sys.stdout or sys.stdout.buffer
ps.begin_document(title)
draw the image (75 dpi)
ps.image(box, im, 75)
ps.rectangle(box)
draw title
ps.setfont("HelveticaNarrow-Bold", 36)
ps.text((3 * 72, 4 * 72), title)
ps.end_document()