技术栈
ocr
云老大TG:@yunlaoda360
2 小时前
人工智能
·
ocr
·
腾讯云
腾讯云国际站代理商的OCR有什么优势呢?
腾讯云国际站 OCR 本身具备高精度识别、全球化适配、合规性强等多重核心优势,通过其代理商合作接入该服务时,除了能获得 OCR 产品本身的技术能力,还可享受代理商的专属配套服务,具体优势如下:
翔云 OCR API
1 天前
前端
·
数据库
·
人工智能
·
mysql
·
ocr
API让文档信息“活”起来:通用文档识别接口-开发者文字识别API
在数字化转型浪潮席卷各行各业的今天,企业每天仍要面对海量的纸质/电子文件、扫描件、PDF报告等非结构化文档。如何快速、准确地将这些“沉睡”的文字信息转化为可编辑、可分析、可流转的数字资产?文字识别衍生产物文档识别接口,或许可满足您的需求!
Chunyyyen
2 天前
学习
·
计算机视觉
·
ocr
【第二十六周】OCR学习01
本周围绕图像预处理与 OCR 文字提取展开,系统学习了图像滤波(高斯、中值、拉普拉斯、双边滤波)、背景分割(阈值化、边缘检测等)、数据集增强(翻转 / 旋转、裁剪等)、像素值调整(二值化、灰度化、归一化)四类核心图像预处理技术的原理与应用场景。 同时,以 EasyOCR 为工具搭建图片文字提取器,展示了从图像读取、灰度化 / 高斯滤波降噪到文本识别的完整流程,还进一步探究了裁剪、旋转等图像调整对识别精度的影响,并实现了为识别文本添加检测边框的可视化功能。
恶猫
3 天前
ocr
·
文字识别
·
自动翻译
·
翻译
·
划词翻译
·
截图翻译
STranslate 翻译 工具 v2.0.0 绿色便携版 翻译、OCR工具
STranslate翻译是一款免费的 Windows 划词翻译与 OCR(光学字符识别)文字识别工具,通过快捷键可实现屏幕上任意区域的文字识别与翻译功能,简单易用。
垦***耪
3 天前
ocr
台达 DVP ES2 与 3 台英威腾 GD 通讯程序(TDES - 12)开发实战
台达DVP ES2与3台英威腾GD通讯程序(TDES-12) 可直接用于实际的程序带注释,并附送触摸屏有接线方式和设置,通讯地址说明等。 程序采用轮询,可靠稳定 器件:台达DVP ES2系列PLC,3台英威腾GD系列变频器,昆仑通态7022Ni 功能:实现频率设定,启停控制,实际频率读取 资料:带注释触摸屏接线和设置说明
MonkeyKing_sunyuhua
4 天前
pdf
·
ocr
使用ARQ做PDF OCR和 图片OCR的任务的方案
一、业务目标 & 前提假设业务目标 • 支持 PDF OCR(多页)和 图片 OCR • 任务耗时可能较长(几十秒~几分钟) • 要求: • 支持大量并发任务,不会把 FastAPI 顶死 • 支持重试(云 OCR 抖一下不要直接失败) • 支持服务重启后任务可恢复(至少未执行/挂一半的任务还能补偿) • 支持任务状态查询(PENDING/RUNNING/SUCCESS/FAILED/进度)
kevin 1
4 天前
人工智能
·
自动化
·
ocr
合同盖章前,如何比对差异,确保纸质版与电子版100%一致?
如果要快速发现两份合同间的差异,最可靠的方案是使用智能文档比对系统,它能自动、精准地发现所有文本差异,避免人工比对的风险。
AI人工智能+
4 天前
ocr
·
文档抽取
·
授权委托书识别
授权委托书识别技术:利用深度学习和NLP实现纸质文档的智能解析
在数字化浪潮席卷各行各业的今天,纸质文档的电子化处理已成为提升效率的关键环节。授权委托书作为法律、商业和日常事务中广泛使用的重要文件,其信息提取的准确性与效率直接影响着业务流程的顺畅度。传统的人工处理方式不仅耗时耗力,还容易因疲劳或疏忽导致错误。随着人工智能技术的成熟,基于深度学习的授权委托书识别技术应运而生,正在彻底改变这一领域的作业模式。
大强同学
4 天前
ocr
ShareX - 错误:英语 language is not available in this system for OCR.
前几天我电脑主板坏了重装了系统,使用ShareX的快捷键OCR功能时提示如下看了官方的文档没有看懂后来上网查了下,在首选语言里添加下英语就可以了
不惑_
5 天前
ocr
在 Rokid 眼镜上实现工业巡检与 OCR,识别、理解与指导的现场智能
在电力、石化与制造等行业,巡检工作长期依赖人工目视与纸质记录,效率与准确性极易受光照条件、反光干扰、视线遮挡及人员疲劳等因素影响。 借助 Rokid AR 眼镜 进行第一视角的图像采集与叠加显示,并深度融合 OCR(光学字符识别)、条码识别与仪表读数推理 技术,可以将“识别 → 理解 → 指导”的数字化链路直接落地于巡检现场。这一方案不仅形成了完整的数据闭环,更显著降低了漏检率与误判率。
翔云 OCR API
5 天前
开发语言
·
人工智能
·
python
·
计算机视觉
·
ocr
赋能文档的数字化智能处理:通用文字/文档/合同识别接口
在数字化转型的浪潮中,海量的纸质文档、图片信息如何快速、准确地转化为可编辑、可分析的结构化数据,是横亘在众多企业面前的效率壁垒。手动录入不仅耗时费力、错误率高,更无法适应现代业务对实时性与自动化处理的迫切需求。
番石榴AI
6 天前
java
·
python
·
ocr
java版的ocr推荐引擎——JiaJiaOCR 2.0重磅升级!纯Java CPU推理,新增手写OCR与表格识别
在OCR技术落地过程中,Java开发者常面临"Python生态繁荣,Java集成困难"的困境——要么依赖exe/dll外部文件,要么跨平台部署踩坑不断。如今,JiaJiaOCR 2.0重磅升级,不仅延续CPU推理优势,更新增手写OCR、版面检测、表格检测与识别三大核心功能,模型加载方式也全面优化,实用性再上一个台阶!
xixixi77777
6 天前
人工智能
·
rnn
·
学习
·
架构
·
cnn
·
ocr
·
图像识别
CRNN(CNN + RNN + CTC):OCR识别的经典之作
想象一个自动识别车牌的工厂流水线:过程分解:CNN(视觉质检员):先看整体车牌,找出“哪里是字、哪里是背景”
50084
6 天前
java
·
人工智能
·
flutter
·
华为
·
ocr
存量 Flutter 项目鸿蒙化:模块化拆分与插件替换实战
随着鸿蒙(HarmonyOS)生态的快速发展,越来越多企业开始将存量跨平台项目迁移至鸿蒙系统,以享受其分布式能力、低时延和多设备协同的优势。对于基于 Flutter 开发的存量项目,鸿蒙化过程中面临两大核心挑战:项目架构耦合度高(难以单独适配鸿蒙原生能力)和第三方插件不兼容(多数 Flutter 插件仅支持 Android/iOS,缺乏鸿蒙适配)。
TextIn智能文档云平台
6 天前
开源
·
ocr
开源OCR大模型和闭源工具怎么选?
相关痛点:OCR选型背后的核心困扰 在学术研究、金融分析、法律合同、工程设计等领域,PDF已成为信息存储与传递的核心载体,但包含复杂表格、公式、图表、手写批注、多栏排版的PDF文档,却让OCR技术的应用陷入诸多困境,也让企业在开源OCR大模型与闭源工具的选型上倍感纠结,具体痛点与选型关联紧密。
wxl781227
7 天前
ocr
·
chunk
·
语义分块
OCR TXT文档语义分块技术实现
本文档详细阐述面向OCR输出TXT文件的语义分块实现方案,核心目标是将无结构化、存在乱码/格式不规范的OCR文本,按照语义连贯性和Token长度约束拆分为高质量文本块(Chunk),同时具备完整的性能耗时统计能力。方案兼顾分块效果与工程实用性,解决了OCR文本分块的核心痛点。
青啊青斯
7 天前
ocr
·
paddlepaddle
·
paddle
一、paddleocr的CPU/GPU环境安装
番石榴AI
7 天前
java
·
开发语言
·
ocr
纯 Java 实现的 OCR 推理系统:JiaJiaOCR,告别 exe/dll 依赖!
在OCR(光学字符识别)领域,开源项目多以Python开发为主。这给Java开发者带来了不少困扰:要么调用外部exe可执行文件,增加部署复杂度;
秋9
7 天前
ocr
Tesseract OCR 安装使用 + 自定义字库训练
OCR(Optical Character Recognition):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后由Google进行改进、修改bug、优化,重新发布。
GitCode官方
7 天前
人工智能
·
ocr
Hunyuan OCR & Z-Image-Turbo 正式上线!两大模型在 NPU 加速平台完成部署,开启 AI 识图新时代!
腾讯混元通用视觉语言模型 Hunyuan OCR 与图像生成模型 Z-Image-Turbo 已成功在 AtomGit AI 社区的 NPU 加速平台完成部署,全新上线,现已全面开放体验!