labelstudio ocr标注数据解析

在试用labelstudio标注数据时,通常使用coco格式导出,之前标注ocr信息时,无论如何都切不出来对应的文字块,反复百度、google都没有现成的提示,后来翻labelstudio的官方文档得到提示。

The units the x, y, width and height of image annotations are provided in percentages of overall image dimension.

翻译如下:图像注释的x、y、宽度和高度的单位以整体图像尺寸的百分比提供。

根据这个原则,转换一下coco中的x、y坐标才能得到文字块在图片中正确的位置:

假如导出的数据x、y、width、height分别如下:

python 复制代码
pixel_x, pixel_y, pixel_width, pixel_height = 63,83,20,7 # 导出数据
original_width, original_height = 1650, 2314 # 图片的长宽

其实际的坐标如下:

python 复制代码
x = pixel_x/100 * original_width
y = pixel_y/100 * original_height
width = pixel_width/100 * original_width
height = pixel_height/100 * original_height

# x,y,width, height == > (1039.5, 1920.62, 330.0, 161.98000000000002)

实际中将坐标更换为整数在numpy中索引:

python 复制代码
x,y,width, height = [int(i) for i in [x,y,width, height]]

#子图
text_area = img[y:y+height,x:x+width,:] 

记录一下,以防日后使用忘记了

相关推荐
金智维科技官方15 小时前
如何结合NLP(自然语言处理)技术提升OCR系统的语义理解和上下文感知能力?
人工智能·自然语言处理·ocr
Hello server21 小时前
OLMo OCR:让文字从图片里“跳”出来的魔法工具
ocr
闰土小蒋3 天前
thinkphp5对接阿里云ocr试卷切题
阿里云·云计算·ocr
缘来的精彩3 天前
Android OCR技术实现与优化指南
android·ocr·androidndk
妄想出头的工业炼药师4 天前
开源ocr
ocr
资源大全免费分享4 天前
全新开源 OCR 模型:精准识别复杂内容,迈向 2.0 时代!
ocr
少年码客9 天前
C#中开发OCR应用时,以下是一些推荐的开源库和工具
开发语言·c#·ocr
山居秋暝LS9 天前
图像处理案例06 OCR应用
opencv·计算机视觉·ocr
私人珍藏库13 天前
[Windows] Umi-OCR 开源批量文字识别 支持图片,文档,二维码,截图等
ocr
hwshea13 天前
Tesseract OCR使用
ocr