最近处理高分卫星影像的瓦片切割,记录几个实用的点。
TIF 分页
TIF 内部是分页结构,一个文件里可以放多张图。GeoTIFF 如果带金字塔(Overview),pages[0] 是分辨率最高的原图,后面依次是降采样层。读取时注意取对页。
读取:tifffile + zarr
tifffile 打开 TIF 后,如果文件没有压缩,可以直接用 memmap 做内存映射读取,效率最高。但如果 TIF 带压缩(LZW、Deflate 等),memmap 无法使用,这时通过 zarr 接口按块读取是比较好的替代方案,不需要把整个影像加载到内存。zarr 返回的是数组接口,做多线程并行切块也比较方便,不用自己管文件指针的偏移。
输出:turbojpeg
瓦片 JPEG 编码用 turbojpeg,比 Pillow 和 OpenCV 快。
uint16 拉伸:2%-98% 分位
高分影像是 uint16,直接线性映射到 0-255 效果不好,极值噪点会把整体压暗。实际做法是取全图 2% 和 98% 分位值做线性拉伸,再 clip 到 [0, 255]。分位值要在全图级别统一计算,逐块算会导致色彩不一致。
判空:综合 0 和 65535
普通 TIF 判空看全黑就行,高分影像的无效区域可能是 0 也可能是 65535。另外第四通道不一定是 Alpha,很可能是 NIR 近红外,不能当透明度用。判空要同时考虑全通道 0 值和 65535 值。
通道顺序:按波段组合重排
高分影像的波段排列和显示顺序不是一回事:
- 真彩色:B3-B2-B1 对应 R-G-B
- 标准假彩色:B4-B3-B2 对应 R-G-B
输出 JPEG 前需要按需求重排通道,直接取前三个波段颜色多半是错的。