技术栈

surya

Cyan_RA9
3 小时前
java·linux·python·ocr·conda·paddle·surya
如何利用 Paddle-OCR 丝滑进行复杂版面 PDF 的批量化OCR处理?一句话总结:Surya的检测和识别模型本身质量不错,但其阅读顺序算法在处理 双栏或者 三栏 等复杂版面文本时,容易发生左右栏内容混杂。而 Paddle-OCR 的 PP-StructureV3 从模型层面解决了这个问题,这也是 up 最终放弃Surya的直接原因。
机器白学
1 年前
目标检测·ocr·1024程序员节·surya
从零开始使用Surya-OCR最新版本0.6.1——最强文本检测模型:新添表单表格检测识别目录一、更新概述二、环境安装1.基础环境配置2.模型参数下载3.参数地址配置——settings.py
伊织code
2 年前
pdf·ocr·布局·layout·surya·text line
Surya - OCR、布局分析、阅读顺序、语言检测Surya 实现 OCR、布局分析、阅读顺序、90多种语言的行检测。它适用于一系列文档(有关详细信息,请参阅 用法 和 基准测试)。
我是有底线的