dbnet轻型网络文本检测 - python 实现

DataBall 助力快速掌握数据集的信息和使用方式,会员享有 百种数据集,持续增加中。

需要更多数据资源和技术解决方案,知识星球: "DataBall - X 数据球(free)"


通过dbnet对图片进行文本框检测。

dbnet特点:

1) 一个轻型网络,cpu可以实时推理;

2)对图片的旋转文字进行定位;

3)对于图片的定位召回适中。

对于简单场景可以满足需求。

实现代码如下:

python 复制代码
import cv2
from models import DBNET


if __name__ == "__main__":
    text_handle = DBNET(MODEL_PATH="./models/dbnet.onnx")
    img = cv2.imread("images/2.jpg")
    # 文本检测
    box_list, score_list = text_handle.process(img,short_size=320)
    # 打印 置信度 和 对应的区域框
    print()
    for i in range(len(score_list)):
        print("[{}] 置信度 score:{:.2f} , 边界框 x1y1x2y2x3y3x4y4 :{}".format(i+1,score_list[i],box_list[i].reshape(-1)))
    # 显示文本检测框可视化结果
    img = draw_bbox(img, box_list)
    # 保存检测结果图
    cv2.imwrite("test_result.jpg", img)

    cv2.namedWindow("img",0)
    cv2.imshow("img",img)

    cv2.waitKey(0)

log显示如下:

python 复制代码
[1] 置信度 score:0.74 , 边界框 x1y1x2y2x3y3x4y4 :[118 290 213 247 232 288 136 332]
[2] 置信度 score:0.76 , 边界框 x1y1x2y2x3y3x4y4 :[109 260 203 223 216 256 122 293]
[3] 置信度 score:0.72 , 边界框 x1y1x2y2x3y3x4y4 :[100 236 187 194 201 224 114 266]
[4] 置信度 score:0.74 , 边界框 x1y1x2y2x3y3x4y4 :[ 87 205 176 169 188 198  98 233]
[5] 置信度 score:0.71 , 边界框 x1y1x2y2x3y3x4y4 :[ 69 168 168 133 182 174  84 208]

示例如下:

​​​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好!

相关推荐
Godspeed Zhao几秒前
从零开始学AI5——数学应知应会0
人工智能
腾讯云大数据几秒前
【数据湖仓】腾讯云发布面向AI的数据湖方案:TCLake+EMR打造AI-Ready数据底座
人工智能·云计算·腾讯云
橘子师兄几秒前
C++AI大模型接入SDK—API接入大模型思路
开发语言·数据结构·c++·人工智能
羞儿几秒前
mAP, AUOCR, AUPR怎么计算、怎么用
人工智能·计算机视觉·指标计算
DS随心转APP1 分钟前
豆包输出word指令
人工智能·ai·chatgpt·deepseek·ds随心转
java1234_小锋3 分钟前
【AI大模型面试题】在训练超大规模语言模型(如千亿参数级别)时,除了显存限制,最主要的训练挑战是什么?
人工智能·语言模型·自然语言处理
戴西软件10 分钟前
戴西软件发布3DViz设计与仿真数据轻量化平台
大数据·人工智能·安全·机器学习·汽车
喵手10 分钟前
Python爬虫零基础入门【第七章:动态页面入门(Playwright)·第1节】Playwright 第一次:打开页面、等待元素、拿到渲染后 HTML!
爬虫·python·爬虫实战·动态页面·playwright·python爬虫工程化实战·零基础python爬虫教学
码农三叔12 分钟前
(4-1)机械传动系统与关节设计:关节驱动方式对比
人工智能·架构·机器人·人形机器人
小汤圆不甜不要钱14 分钟前
「Datawhale」RAG技术全栈指南 Task 3
人工智能·深度学习·机器学习·rag