[python-opencv] PNG 裁切物体

拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。

  1. 读取PNG的4个通道
python 复制代码
image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

附参数说明:

|---------------------------------|------------------------------------------|
| IMREAD_UNCHANGED = -1 | 返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道 |
| IMREAD_GRAYSCALE = 0 | 将图像转换为单通道灰度图像 |
| IMREAD_COLOR = 1 | 将图像转换成3通道BGR彩色图像 |
| IMREAD_ANYDEPTH = 2 | 在输入具有相应深度时返回16位/32位图像,否则将其转换为8位 |
| IMREAD_ANYCOLOR = 4 | 图像可能以任何颜色格式读取 |
| IMREAD_LOAD_GDAL = 8 | 使用gdal驱动程序加载图像 |
| IMREAD_REDUCED_GRAYSCALE_2 = 16 | 将图像转换为单通道灰度图像且图像大小减少1/2 |
| IMREAD_REDUCED_COLOR_2 = 17 | 将图像转换为3通道BGR彩色图像且图像大小减少1/2 |
| IMREAD_REDUCED_GRAYSCALE_4 = 32 | 将图像转换为单通道灰度图像且图像大小减少1/4 |
| IMREAD_REDUCED_COLOR_4 = 33 | 将图像转换为3通道BGR彩色图像且图像大小减少1/4 |
| IMREAD_REDUCED_GRAYSCALE_8 = 64 | 将图像转换为单通道灰度图像且图像大小减少1/8 |
| IMREAD_REDUCED_COLOR_8 = 65 | 将图像转换为3通道BGR彩色图像且图像大小减少1/8 |
| IMREAD_IGNORE_ORIENTATION = 128 | 不会根据EXIF的方向标志旋转图像 |

  1. 遍历文件夹获取每个图像文件:
python 复制代码
def traverse_folder(folder_path):
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            # 文件的绝对路径
            file_path = os.path.join(root, file)
            print(file_path)
  1. 找到PNG中物体的ROI:
python 复制代码
def findROI(img_path):
    image = cv.imread(img_path)
    gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
    # 获取图像的宽高通道
    height, width, channels = image.shape
    # 进行边缘检测
    edges = cv.Canny(gray, 50, 255)

    xmin = width - 1
    ymin = height - 1
    xmax = 0
    ymax = 0
    for i in range(width):
        for j in range(height):
            if edges[j, i] != 0:
                if xmin > i:
                    xmin = i
                if xmax < i:
                    xmax = i
                if ymin > j:
                    ymin = j
                if ymax < j:
                    ymax = j

    print("width : ", xmax - xmin)
    print("height : ", ymax - ymin)
    return xmin,xmax,ymin,ymax
  1. 遍历文件夹将jpg转PNG
python 复制代码
def traverse_folder_convertJPGtoPNG(folder_path, output_path):
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            # 文件的绝对路径
            file_path = os.path.join(root, file)
            print(file_path)
            # 获取没有后缀的文件名
            filename_without_extension = os.path.splitext(file)[0]
            print(filename_without_extension)
            #print(output_path + '/' + filename_without_extension + '.png')
            jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')

def jpg_to_png(jpg_path, png_path):
    img = Image.open(jpg_path)  # 打开jpg文件
    img.save(png_path, 'PNG')  # 保存为png文件
  1. 按照指定ROI图像获取图像区域并保存
python 复制代码
def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):
    image = cv.imread(image_path, cv.IMREAD_UNCHANGED)
    height, width, channels = image.shape
    print("图像宽度:", width)
    print("图像高度:", height)
    print("图像频道:", channels)
    ymin=math.floor(height*0.5-outputHeight*0.5)
    ymax=math.ceil(height*0.5+outputHeight*0.5)
    xmin=math.floor(width*0.5-outputWidth*0.5)
    xmax=math.ceil(width*0.5+outputWidth*0.5)

    cropped_image = image[ymin:ymax, xmin:xmax]
    # 保存为png文件
    cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])  
  1. 按照问题所在ROI获取图像区域
python 复制代码
def crop_and_save_image(image_path, output_path):
    image = cv.imread(image_path, cv.IMREAD_UNCHANGED)
    gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
    height, width, channels = image.shape
    edges = cv.Canny(gray, 50, 255)
    print(edges)
    xmin = width - 1
    ymin = height - 1
    xmax = 0
    ymax = 0
    for i in range(width):
        for j in range(height):
            if edges[j,i] != 0:
                if xmin > i:
                   xmin = i
                if xmax < i:
                   xmax = i
                if ymin > j:
                   ymin = j
                if ymax < j:
                   ymax = j

    cropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]
    cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9]) 

Imwrite参数说明

|------------------------------------|-------------------------------------------------------------------------------------------------------------------------|
| IMWRITE_JPEG_QUALITY | 对于JPEG,它可以是从0到100的质量(越高越好)。默认值是95。 |
| IMWRITE_JPEG_PROGRESSIVE | 启用JPEG功能,0或1,默认为False。 |
| IMWRITE_JPEG_OPTIMIZE | 启用JPEG功能,0或1,默认为False。 |
| IMWRITE_JPEG_RST_INTERVAL | JPEG重新启动间隔,0 - 65535,默认为0 - 不重新启动。 |
| IMWRITE_JPEG_LUMA_QUALITY | 单独的亮度质量等级,0 - 100,默认为0 - 不使用。 |
| IMWRITE_JPEG_CHROMA_QUALITY | 独立的色度质量等级,0 - 100,默认为0 - 不使用。 |
| IMWRITE_PNG_COMPRESSION | 对于PNG,它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。 |
| IMWRITE_PNG_STRATEGY | cv :: ImwritePNGFlags之一,默认为IMWRITE_PNG_STRATEGY_DEFAULT。 |
| IMWRITE_PNG_BILEVEL | 二进制级PNG,0或1,默认为0。 |
| IMWRITE_PXM_BINARY | 对于PPM,PGM或PBM,它可以是二进制格式标志,0或1.默认值为1。 |
| IMWRITE_WEBP_QUALITY | 对于WEBP,它可以是从1到100的质量(越高越好)。默认情况下(没有任何参数),质量超过100的情况下使用无损压缩。 |
| IMWRITE_PAM_TUPLETYPE | 对于PAM,将TUPLETYPE字段设置为为格式定义的相应字符串值。 |
| IMWRITE_TIFF_RESUNIT | 对于TIFF,用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。 |
| IMWRITE_TIFF_XDPI | 对于TIFF,用于指定X方向DPI。 |
| IMWRITE_TIFF_YDPI | 对于TIFF,用于指定Y方向DPI。 |
| IMWRITE_TIFF_COMPRESSION | 对于TIFF,用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意,对于深度为CV_32F的图像,仅使用libtiff的SGILOG压缩方案。对于其他支持的深度,可以通过此标志指定压缩方案; LZW压缩是默认值。 |
| IMWRITE_JPEG2000_COMPRESSION_X1000 | 对于JPEG2000,用于指定目标压缩率(乘以1000)。该值可以是0到1000.默认值是1000 |

相关推荐
陈苏同学1 分钟前
4. 将pycharm本地项目同步到(Linux)服务器上——深度学习·科研实践·从0到1
linux·服务器·ide·人工智能·python·深度学习·pycharm
唐家小妹4 分钟前
介绍一款开源的 Modern GUI PySide6 / PyQt6的使用
python·pyqt
XKSYA(小巢校长)35 分钟前
NatGo我的世界联机篇
开发语言·php
羊小猪~~36 分钟前
深度学习项目----用LSTM模型预测股价(包含LSTM网络简介,代码数据均可下载)
pytorch·python·rnn·深度学习·机器学习·数据分析·lstm
Cons.W38 分钟前
Codeforces Round 975 (Div. 1) C. Tree Pruning
c语言·开发语言·剪枝
憧憬成为原神糕手40 分钟前
c++_ 多态
开发语言·c++
VBA633740 分钟前
VBA信息获取与处理第三个专题第三节:工作薄在空闲后自动关闭
开发语言
Marst Code1 小时前
(Django)初步使用
后端·python·django
985小水博一枚呀1 小时前
【对于Python爬虫的理解】数据挖掘、信息聚合、价格监控、新闻爬取等,附代码。
爬虫·python·深度学习·数据挖掘
立秋67891 小时前
Python的defaultdict详解
服务器·windows·python