技术栈
ocr
AI人工智能+
15 小时前
人工智能
·
ocr
·
银行卡识别
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
在移动支付普及、金融业务线上化的浪潮下,银行卡识别技术已成为连接实体卡片与数字世界的关键桥梁。它利用人工智能与图像处理技术,让冰冷的塑料卡片瞬间“开口说话”,实现高效、准确的信息录入与管理。
deephub
1 天前
人工智能
·
深度学习
·
神经网络
·
ocr
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
在传统OCR技术日趋成熟的今天,一个仅有1.7B参数的视觉语言模型正在重新定义文档处理的技术边界。Dots.ocr的出现标志着OCR领域从传统多模块流水线向统一视觉语言建模的重要转变,其在多项基准测试中超越大参数模型的表现,预示着"小而精"可能比"大而全"更具实用价值。
ccut 第一混
2 天前
c#
·
ocr
·
halcon
c#联合Halcon进行OCR字符识别(含halcon-25.05 百度网盘)
通过网盘分享的文件:halcon-25.05.0.0-x64-win64 链接: https://pan.baidu.com/s/1XAx-8ZQM-ZHkgHIc-dhCYw
R-G-B
5 天前
c++
·
opencv
·
ocr
·
发票精准定位
·
提取指定单元格数据
·
倾角计算
·
旋转矫正
【04】OpenCV C++实战篇——实战:发票精准定位,提取指定单元格数据。(倾角计算、旋转矫正、产品定位、目标定位、OCR文字提取)
用户需求描述:1.自动拍照: 工作台垂直方向安装一对红外对管,当品票放置在工作台上,红外对管被遮挡触发自动拍照及后续自动识别工作; 2.旋转矫正: 使图片水平; 3.产品定位: 确定一个定位点,每张图片都固定在相同的位置: 4.目标ROI: 以定位点为参考点确定n个目标提取位置的坐标,截取ROI; 4.文字提取: OCR文字提取;
EkihzniY
5 天前
pdf
·
ocr
单层 PDF 与双层 PDF:一字之差,功能大不同
日常接触的 PDF 文档,看似相似却分 “单层” 与 “双层”,核心区别在于是否包含可编辑的文本层。单层 PDF本质是 “图片包裹体”,文字以像素形式存在(如扫描生成的文件)。它像一张纸质文档的照片,无法直接复制、搜索或修改文字,必须借助 OCR 技术识别后才能提取内容。
郭庆汝
9 天前
ocr
本地服务器端部署基于大模型的通用OCR项目——dots.ocr
dots.ocr 是一个强大的多语言文档解析器,它在一个单一的视觉-语言模型中统一了布局检测和内容识别,同时保持良好的阅读顺序。尽管其基础是紧凑的1.7B参数LLM,但它实现了最先进的(SOTA)性能。
EkihzniY
10 天前
ocr
OCR 精准识别验讫章:让登记与校验更智能
验讫章作为通关、办公等场景的重要凭证,其识别与登记曾依赖人工核对,效率低且易出错。OCR 技术的介入,让这一过程实现了自动化升级。
CodeCraft Studio
10 天前
java
·
人工智能
·
python
·
ocr
·
.net
·
aspose
·
ocr工具
使用 Aspose.OCR 将图像文本转换为可编辑文本
从图像中提取文本是企业应用程序和日常生产力任务中的常见需求。处理扫描文档、屏幕截图或印刷文本照片时,将基于图像的内容转换为可编辑文本可以节省时间、提高自动化程度并增强可搜索性。JPG、PNG 和 TIFF 等图像格式将文本存储为视觉像素,而不是实际字符。这使得如果不使用光学字符识别 (OCR),就无法搜索、复制或编辑内容。在本文中,我们将探讨如何使用 Aspose.OCR 将图像文本转换为可编辑文本。请按照本分步指南,使用 Python 和 C# 以及Java构建您自己的图像文本到文本转换工具。
TextIn智能文档云平台
11 天前
人工智能
·
ocr
·
大模型文档应用
当文档包含图文混排表格时,如何结合大模型(如DeepSeek-VL)和OCR提取数据
从金融研报、市场分析材料到学术论文,柱状图、折线图、散点图等图表经常被运用于记录和直观表现数据。有时候我们需要将表格中的部分数据提取出来,进行专门的分析和使用。
DisonTangor
12 天前
语言模型
·
开源
·
ocr
小红书开源dots.ocr:单一视觉语言模型中的多语言文档布局解析
dots.ocr 是一款强大的多语言文档解析器,它将版面检测与内容识别统一整合到单一视觉语言模型中,同时保持出色的阅读顺序还原能力。尽管其基础模型仅为17亿参数的轻量级大语言模型(LLM),但性能达到了业界顶尖水平(SOTA)。
NullPointerExpection
12 天前
spring boot
·
llm
·
ocr
·
springai
·
deepseek
·
mcp
dify + mcp 实现图片 ocr 识别
pom.xml:application.yml:application-dev.yml:BootApplication.java:
EkihzniY
15 天前
ocr
OCR 赋能自动阅卷:让评分更高效精准
考试阅卷中,OCR 技术正成为高效助手,尤其在客观题和标准化答题场景中表现亮眼。将考生答题卡扫描后,OCR 能快速识别填涂的选项、手写数字或特定符号,与标准答案比对后自动判分。相比人工阅卷,它能在短时间内完成成百上千份试卷的处理,大幅减少老师的重复劳动,还能避免视觉疲劳导致的误判。
Stara0511
15 天前
人工智能
·
大模型
·
ocr
·
飞书
·
工作流
·
ai agent
·
coze
基于Coze平台的自动化情报采集与处理引擎—实现小红书图文到飞书的端到端同步
本文介绍了一个基于Coze平台的智能工作流设计与实现,旨在解决内容运营中信息采集、处理与归档的自动化难题。该系统通过集成小红书内容提取、OCR文字识别及飞书多维表格同步三大核心功能,构建了一套完整的“信息获取-智能解析-结构化存储”闭环。项目不仅实现了技术上的创新,更在实际应用中显著提升了工作效率,为内容创作者和运营团队提供了强大的数据支持。
悠哉悠哉愿意
16 天前
笔记
·
python
·
嵌入式硬件
·
学习
·
视觉检测
·
ocr
【电赛学习笔记】MaixCAM 的OCR图片文字识别
本文是对MaixPy官方文档 MaixCAM MaixPy 实现 OCR 图片文字识别 - MaixPy 的项目实践整理与拓展,侵权即删。
pingzhuyan
17 天前
python
·
ai
·
llm
·
ocr
·
conda
python入门篇12-虚拟环境conda的安装与使用
python基础, 之前专栏中介绍了.venv的虚拟环境, 本篇则介绍另一种更加方便的虚拟环境使用, conda
DogDaoDao
18 天前
人工智能
·
深度学习
·
开源
·
github
·
ocr
·
图像识别
·
zerox
GitHub开源项目Zerox:AI驱动的OCR革命
零样本学习的实现原理复杂布局解析核心技术分布式处理框架数据来源:CSDN开发者实测报告及AI工具导航站测评
程序视点
18 天前
ocr
·
视频字幕提取软件
·
望言ocr
·
硬字幕识别工具
·
开源ocr工具
·
字幕提取方法
·
视频转文字软件
望言OCR视频字幕提取2025终极评测:免费版VS专业版提全方位对比(含免费下载)
大家好,欢迎来到程序视点!我是你们的老朋友.小二!望言OCR作为专业的视频硬字幕提取工具,在AI视频处理领域占据重要地位。
开开心心_Every
19 天前
javascript
·
人工智能
·
ocr
·
excel
·
语音识别
·
symfony
多线程语音识别工具
软件介绍本文介绍一款支持大厂接口的语音转文字工具,具备免配置、免费使用的特点。软件特性该工具是一款完全免费的桌面端应用程序,部署于开源社区平台,其核心优势在于整合了多家技术供应商的接口资源。
Hi20240217
19 天前
pdf
·
flask
·
llm
·
ocr
·
阅读器
支持OCR和AI解释的Web PDF阅读器:解决大文档阅读难题
当你在手机上阅读扫描版PDF文档(特别是超长文档如2000页的书籍)时,是否遇到过这些问题:技术解释:扫描版PDF本质上是图片合集,手机自带的OCR功能对长文档处理能力有限,特别是:
kevin 1
19 天前
ocr
如何识别发票特殊版式?OCR大模型如何颠覆传统并保证准确率?
在特殊发票版式识别方面,越来越多的公司开始使用OCR大模型,通过输入提示词,利用大模型强大的泛化能力,无需预设模板即可精准抽取任意发票版式信息,从根本上解决了传统OCR面对新版式时识别率低、维护成本高的问题。