ocr

我有2只猫15 小时前
人工智能·python·django·ocr
LabelStudio二次开发1、本地部署labelstudio 下载LabelStudio项目到本地,记住使用python3.11, 过高会有依赖冲突问题 2、构建后端
余俊晖1 天前
人工智能·ocr·多模态
多模态文档解析后处理开源模型:MinerU-Popo方案思路提升RAG性能目前各类的文档解析方案(VLM-OCR)都是基于【单页】文档进行解析,输出每页文字、表格、图片+坐标框,但存在4类跨页缺点:
超人也会哭️呀1 天前
人工智能·ai·llm·ocr·vlm·视觉模型·dots.ocr
视觉模型中的坐标漂移之前提过,我们搞了个企业级知识库系统,结果文档解析时总出幺蛾子——时不时就报错"解析失败"。我这人对 Bug 的容忍度基本为零,决定死磕到底。
开开心心就好2 天前
运维·科技·macos·docker·计算机外设·ocr·powerpoint
无弹窗不更新的PC本地播放工具软件介绍QQ影音PC端最后一次更新是2020年4月15日,之后就彻底停更了,2022年还全平台下架,官方一直没有给出回应,现在已经属于弃更状态。不过虽然停更下架了,现在拿来用依然很靠谱!
MageGojo2 天前
ocr·接口·api·数据提取·火车票识别
OCR 火车票识别 API 服务介绍与使用考量光学字符识别(OCR)技术在自动化数据处理领域扮演着重要角色。针对火车票这类结构化票据的识别,能够大幅提升信息录入的效率和准确性。本文将基于 https://apizero.cn/marketplace/ocr-train-ticket 这一服务页面,介绍 OCR 火车票识别 API 的基本概念,并讨论在实际集成和应用此类服务时需要考量的技术要素。请注意,由于所引用的页面资料未能成功抓取,本文中所有关于该特定服务的功能、接口参数、价格及认证方式的描述均基于 URL 推测,具体信息需以官方文档为准。
星光一影2 天前
开源·ocr
一个开源 OCR 引擎,支持 100+ 语言,能识别表格、公式、印章,而且完全免费OCR · 文档解析 · 大模型数据预处理100+ 语言 · 端到端识别 · 表格/公式/印章 · Apache 协议
AI人工智能+3 天前
人工智能·深度学习·计算机视觉·自然语言处理·ocr
一种基于深度学习的端到端户口本识别技术,通过多阶段神经网络架构实现高精度信息提取随着数字政府与智慧政务建设的深入推进,海量纸质档案的数字化转型成为关键痛点。户口本作为居民身份关系的核心法律凭证,其信息录入长期依赖人工操作,效率低且易出错。本文探讨一种基于神经网络的端到端户口本识别技术。该技术不仅实现了高精度的文字检测与识别(OCR),更引入了语义理解机制,能够自动区分户主页与成员页,精准提取并结构化关键数据,显著提升了信息处理的自动化水平与管理效能。
开开心心就好2 天前
运维·python·科技·游戏·计算机外设·ocr·powerpoint
支持多显示器的Windows高效分屏工具软件介绍今天要聊的这款软件叫Screen+,是AOC开发的免费Windows分屏工具,能把单个显示器分成多个独立区域,帮你提升多任务处理的效率。
YXWik62 天前
人工智能·python·ocr
图片 OCR 文字提取 (Python + AI 模型(ModelScope))模型地址:https://www.modelscope.cn/models OCR 文字识别(ocr_recognition)
AI人工智能+4 天前
深度学习·计算机视觉·自然语言处理·ocr·表格识别
基于深度学习与计算机视觉的表格识别技术:不仅能精准提取表格中的文字内容,更能深度解析复杂的表格结构,实现版面信息的完美还原在数字化转型的浪潮中,数据是企业的核心资产。然而,据相关统计显示,全球约80%的企业数据以非结构化或半结构化的形式存在,其中表格(Table)是最常见且最具价值的载体之一。从财务报表、医疗病历到物流单据,表格承载着海量关键信息。然而,传统的光学字符识别(OCR)技术往往只能提取文字内容,却难以理解表格的行列结构,导致数据“孤岛”化,无法直接用于下游分析。
石榴树下的七彩鱼4 天前
java·python·ocr·api接口·财务自动化·石榴智能·发票ocr
发票OCR识别API接入教程:从图像到结构化数据的完整实战(附Python/Java/PHP/JS代码)#发票OCR #财务自动化 #API接入 #Python教程 #Java开发 #PHP编程 #NodeJS #ERP集成 #石榴智能
庖丁AI4 天前
人工智能·pdf·ocr
PDF解析工具怎么选?OCR、表格提取和结构化输出有什么区别做PDF文档处理时,很多需求一开始都会被概括成“PDF转Excel”“PDF转文字”“PDF转Markdown”。但真到企业批量处理、知识库入库、数据清洗或系统集成时,问题通常不只是转换格式,而是PDF里的内容能不能被准确识别、正确拆分,并以合适的结构交给后续流程。
lqqjuly4 天前
ocr
OCR 与文档智能深度解析(OCR & Document Intelligence)
code_pgf4 天前
深度学习·ocr
CRNN + CTC OCR 原理详解本文面向 OCR 模型部署、轻量化文本识别、ONNX/MNN/C++ 推理落地等工程场景,系统说明 CRNN + CTC 的核心原理、网络结构、训练方式、解码流程、工程部署要点与适用场景。
AI人工智能+5 天前
人工智能·深度学习·ocr·银行卡识别
融合图像处理与模式识别算法的智能银行卡识别系统,为金融行业带来了革命性的效率提升在数字化金融浪潮的推动下,移动支付、在线开户及无卡交易已成为常态。然而,如何快速、准确地将物理世界中的银行卡信息转化为数字世界的可用数据,一直是金融科技领域的核心挑战之一。传统的光学字符识别(OCR)技术在处理复杂背景、反光卡片或模糊图像时往往力不从心。如今,随着人工智能与深度学习技术的飞速发展,融合图像处理与模式识别算法的智能银行卡识别系统应运而生,为金融行业带来了革命性的效率提升。
weixin_408099675 天前
ocr·文字识别·api调用·易语言·桌面软件开发·截图识别·石榴智能
用易语言做一个自动文字识别工具(OCR软件开发实战)#易语言 #OCR #文字识别 #API调用 #桌面软件开发 #通用文字识别 #截图识别 #批量识别 #编程实战 #易语言源码 #RPA自动化
weixin_407443875 天前
人工智能·python·计算机视觉·ocr
OCR材料信息提取工具(附件中含代码和数据)本工具可以从图片(JPG、PNG等)和PDF文件中自动识别并提取以下信息:提取的结果会自动保存到Excel文件中。
许彰午6 天前
ocr
医保人工报销OCR识别方案场景: 医院费用清单(A4纸打印,含公章覆盖)→ OCR识别通用名 → 模糊匹配医保字典 → 确定收费等级 原则: 自动匹配 + 例外转人工,不做全自动
半壶清水6 天前
人工智能·opencv·ocr·paddlepaddle
PaddlePaddle、easyocr与OpenCV工具识别书法图片内容,自动批量重命名图片文件的方法在书法学习、古籍数字化项目中,我们常常会收集大量的单字书法图片。这些图片可能来自碑帖扫描、名家手迹或创作练习,文件名往往是杂乱无章的编号(如 IMG_001.jpg、扫描图1.png),给后续的整理、检索和使用带来了极大的不便。手动为每张图片命名不仅耗时耗力,而且容易出错。
AI人工智能+6 天前
深度学习·自然语言处理·ocr·营业执照识别
营业执照识别技术,通过深度学习、图像处理与NLP技术的深度融合,实现了对营业执照信息的快速、精准提取与智能解析在数字化转型的浪潮中,企业注册信息的自动化处理已成为提升商业效率的关键环节。传统的营业执照人工录入方式不仅耗时费力,且极易出现人为错误。随着人工智能技术的飞速发展,基于深度学习技术的高精度OCR识别系统应运而生。该系统深度融合图像处理、模式语言识别与自然语言处理(NLP)技术,实现了对营业执照信息的快速、精准提取与智能解析,彻底改变了企业信息核验的传统模式。