labelstudio ocr标注数据解析

在试用labelstudio标注数据时,通常使用coco格式导出,之前标注ocr信息时,无论如何都切不出来对应的文字块,反复百度、google都没有现成的提示,后来翻labelstudio的官方文档得到提示。

The units the x, y, width and height of image annotations are provided in percentages of overall image dimension.

翻译如下:图像注释的x、y、宽度和高度的单位以整体图像尺寸的百分比提供。

根据这个原则,转换一下coco中的x、y坐标才能得到文字块在图片中正确的位置:

假如导出的数据x、y、width、height分别如下:

python 复制代码
pixel_x, pixel_y, pixel_width, pixel_height = 63,83,20,7 # 导出数据
original_width, original_height = 1650, 2314 # 图片的长宽

其实际的坐标如下:

python 复制代码
x = pixel_x/100 * original_width
y = pixel_y/100 * original_height
width = pixel_width/100 * original_width
height = pixel_height/100 * original_height

# x,y,width, height == > (1039.5, 1920.62, 330.0, 161.98000000000002)

实际中将坐标更换为整数在numpy中索引:

python 复制代码
x,y,width, height = [int(i) for i in [x,y,width, height]]

#子图
text_area = img[y:y+height,x:x+width,:] 

记录一下,以防日后使用忘记了

相关推荐
xyj41892 小时前
《深入理解Java虚拟机JVM高级特性与最佳实践》
ocr
东风西巷1 天前
STranslate(翻译工具OCR工具) 中文绿色版
学习·ocr·电脑·软件需求
XXX-X-XXJ1 天前
三、从 MinIO 存储到 OCR 提取,再到向量索引生成
人工智能·后端·python·ocr
EkihzniY1 天前
车牌 OCR 识别:国庆高速免费通行的 “隐形引擎”
ocr
wt_cs1 天前
OCR API让工作归于调理-文字识别接口-发票、银行卡、文档识别
ocr
qq_546937271 天前
身份证批量ocr
ocr
AI人工智能+1 天前
行驶证识别技术通过OCR和AI实现信息自动化采集与处理,涵盖图像预处理、文字识别及结构化校验,提升效率与准确性
人工智能·深度学习·ocr·行驶证识别
EkihzniY1 天前
医疗发票 OCR 识别:打通医疗费用处理 “堵点” 的技术助手
大数据·人工智能·ocr
AI扶我青云志3 天前
OCR数据流转
ocr
Eiceblue3 天前
Python OCR 技术实践:从图片中提取文本和坐标
开发语言·python·ocr·visual studio code