技术栈
ocr
Sour
12 天前
前端
·
pdf
·
ocr
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
很多人遇到的不是“PDF 不能翻译”,而是 PDF 文件类型和处理方式没分清。表面上看,都是 .pdf 文件;实际处理时,至少要先区分三类情况:
旗讯数字
12 天前
大数据
·
ocr
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
制造业生产车间是企业数据产生的核心阵地,生产巡检、工序记录、质检台账、设备运维等关键信息,长期依靠纸质手写表单留存。海量手写单据承载着产能、不良品、工艺参数、检验结果等核心生产数据,却是企业数字化建设的一大堵点。传统人工抄写录入模式效率低、误差高、数据零散,难以支撑质量追溯、产能分析、精益生产管理。
XTIOT666
12 天前
大数据
·
人工智能
·
嵌入式硬件
·
物联网
·
ocr
多形态护照 OCR 读取器传输机制、识别算法与行业落地技术对比
当下涉外自助设备、政务核验系统开发中,护照 OCR 码(TD3 MRZ OCR-B 字符)自动采集成为标准化刚需。MRZ 字符格式规范严格,普通视觉采集设备无 ICAO 标准字库,字符分割、校验纠错能力不足,识别稳定性无法满足海关、酒店、劳务备案等场景合规要求。深圳市兴通物联科技有限公司自研全系列护照 OCR 读取器,统一搭载优化版 MRZ 光学字符识别算法,通过有线、无线、嵌入式三种硬件形态覆盖全部核验工况,本文从算法底层、传输技术、集成适配三个维度做技术拆解,为硬件选型与系统开发提供参考。 识别算法层
天天代码码天天
12 天前
c++
·
c#
·
ocr
用 TensorRT 加速 PP-OCR:一套 C++ DLL + C# 调用的高性能 OCR 推理方案
目录效果项目特点为什么选择 FP16适用场景测试体验部署建议时间不稳定设置C#调用源码下载说明在 OCR 项目落地中,很多人都会遇到同一个问题:模型效果不错,但推理速度、部署便利性、GPU 兼容性、内存稳定性,很难同时兼顾。
2401_88566519
13 天前
人工智能
·
python
·
opencv
·
计算机视觉
·
ocr
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
光学字符识别(Optical Character Recognition, OCR)是计算机视觉领域的核心应用方向之一,广泛落地于金融身份核验、政务单据录入、工业仪表读数、物流面单识别等场景。当前主流的工业级OCR方案多基于深度学习实现,如PaddleOCR、Tesseract-LSTM等,具备极强的泛化能力,可适配多字体、多场景、多语言的识别需求。
东集Seuic
13 天前
大数据
·
人工智能
·
ocr
食品标签新规 GB 7718-2025 倒计时:产线“首件检验”如何用东集小码哥CRUISE Ge2-M跑通 OCR 智能核对?
随着《食品安全国家标准 预包装食品标签通则》(GB 7718-2025)与新版《食品标识监督管理办法》的正式发布,食品企业迎来了史上最严的“日期标签大考”。面对新规,传统依靠人工肉眼核对产线喷码的方式正在失效,而搭载强悍 CPU 算力的东集小码哥CRUISE Ge2-M,正在用一套成熟的 OCR 视觉识别方案,帮助食品头部企业(如徐福记)重塑线边质检流程。
小鹏linux
13 天前
c++
·
ocr
·
harmonyos
鸿蒙PC迁移:Tesseract OCR C++ 三方库鸿蒙适配全记录
欢迎加入鸿蒙PC开发者社区,共同打造开发者工具生态:鸿蒙PC开发者社区:https://harmonypc.csdn.net/
开开心心就好
13 天前
人工智能
·
安全
·
leetcode
·
贪心算法
·
ocr
·
音视频
·
语音识别
自动生成小学数学题库支持导出Word
软件介绍今天给大家介绍一款小学数学四则运算题库生成工具。这类的工具现在做得是越来越好了,功能方面也是越来越全面。就拿今天这款来说吧,题目的个数、数位、括号、答案、运算这些都能设置,功能相当齐全。
FL1623863129
14 天前
opencv
·
c#
·
ocr
基于C#winform使用纯opencv部署ppocrv5和ppocrv6的onnx模型进行OCR文件检测识别
这是一个基于 C# Windows Forms 的桌面端 OCR(光学字符识别)应用程序,通过集成百度 PaddleOCR v5/v6 系列模型,利用 OpenCV DNN 推理引擎在本地实现高效的文字检测与识别。用户可通过图形界面选择图片,一键完成文字识别,并在界面上直观查看识别结果与文字区域标注框。
AI人工智能+
15 天前
深度学习
·
自然语言处理
·
ocr
·
文档抽取
智能文档抽取系统以专业的文档解析底座和大模型智能语义理解能力为核心,洞察文档的语义内涵与逻辑结构
在信息爆炸的数字化时代,企业、政府机构和各类组织每天都要处理海量的非结构化文档——合同、票据、证照、报告、档案等。这些文档中蕴藏着巨大的数据价值,但传统依靠人工阅读、理解和录入的方式效率低下、成本高昂且容易出错。如何让机器不仅“看见”文档,更能“理解”文档,已成为制约众多行业数字化转型的关键瓶颈。智能文档抽取系统,正是为解决这一痛点而生。
无心水
15 天前
金融
·
pdf
·
ocr
·
pdf解析
·
pdf抽取
·
pdf提取
·
ocr服务
27、私有化部署|PaddleOCR-Server 本地OCR服务搭建
关键词:PaddleOCR私有化部署、企业内网OCR服务、Docker离线部署、PaddleOCR-Server、FastAPI GPU加速、API密钥鉴权、Prometheus监控 适合读者:企业AI架构师、运维工程师、后端开发、数据安全团队
情绪总是阴雨天~
15 天前
笔记
·
学习
·
ocr
OCR光学字符识别技术:完整原理与实战学习笔记
在数字化时代,纸质资料、拍照图片、监控画面中蕴藏着海量文字信息,传统人工录入方式效率低、成本高、易出错,OCR 光学字符识别技术就此成为打通 “图像信息” 与 “文本信息” 的核心桥梁。
Sour
15 天前
pdf
·
ocr
扫描版 PDF 翻译流程:OCR 识别、译文校对和排版保留
在处理外文资料时,经常会遇到一种 PDF:文件后缀是 .pdf,但里面的文字无法复制,也不能直接搜索。这类文件通常是扫描版 PDF,本质上是图片页面,不是带文本层的 PDF。
曲辕RPA
15 天前
ocr
·
rpa
曲辕RPA-鼠标悬停在文字上(OCR)
通过OCR技术识别文字及坐标,然后自动把鼠标指针移动到指定的文字上,当识别区域较大时建议选择高精度,否则可能无法正确识别。当存在多个匹配的文字时该指令会报错
bing_feilong
16 天前
ocr
轻量级OCR
业务:主要识别货架上的角度各式各样的英文字母和数字,8GB内存嵌入式运行。PaddleOCR的PP-OCR系列超轻量模型是平衡精度、资源占用和多角度识别能力的最佳选择。
光之后裔
16 天前
python
·
机器学习
·
ocr
用自定义数据集微调PP-OCRv5文本检测、识别模型
目录1. 用PPOCRLabel标注数据2. 搭建训练环境2.1 拉取预安装 PaddlePaddle 的镜像
王五周八
16 天前
java
·
开发语言
·
ocr
Tesseract OCR的Java使用(附安装包,非常详细)
Tesseract OCR 是一款开源免费、支持离线运行的光学字符识别引擎,能够从图片中提取文字并转为可编辑、复制的文本内容。
AI人工智能+
16 天前
深度学习
·
自然语言处理
·
ocr
·
银行回单识别
银行回单识别技术通过OCR与深度学习实现财务数字化转型
在数字化转型的浪潮中,企业财务管理正经历着从“手工录入”向“智能处理”的深刻变革。作为企业资金流转的核心凭证,银行回单的识别与处理效率直接决定了财务工作的质量与速度。随着人工智能技术的成熟,基于OCR(光学字符识别)与深度学习技术的银行回单识别系统已成为现代财务共享中心的标准配置。
yugi987838
16 天前
开发语言
·
c#
·
ocr
基于C#实现数字识别率的OCR方案
参考 C# OCR光学识别,数字识别率达100% www.youwenfan.com/contentcsv/70116.html
BugShare
16 天前
ocr
·
贴图
把「贴图 + OCR + 翻译 + 长截图 + 录屏」做到极致的截图软件—PixPin
提到截图软件,大多人想到的是 QQ、系统自带之类截图,基本上可以满足日常截图需求,但如果你每天要查文档、写方案、做设计、整理资料,就会发现仅仅有「截图」远远不够。