技术栈
ocr
TextIn智能文档云平台
18 小时前
人工智能
·
ocr
AI文档产品与传统OCR软件的根本区别是什么?
AI 文档产品与传统 OCR 软件的根本区别在于 AI 文档产品能够理解文档内容和结构,而传统 OCR 软件主要是进行字符识别。如果你用传统OCR工具直接从PDF中提取文本,结果往往是乱序、缺失、格式错乱。因为实际文档中常包含公式、表格、手写批注、文字段落等各种难以提取的元素。
doris610
20 小时前
ocr
·
资产管理
·
固定资产管理系统
固定资产管理系统核心功能拆解:批量导入、OCR 识别有多高效?
在企业资产管理中,数据录入的效率与准确性直接影响管理质量。传统人工录入方式不仅耗时费力,还易因人为操作产生误差。易点易动固定资产管理系统作为数字化管理工具,通过批量导入和 OCR 识别两大核心功能,为企业解决资产管理痛点提供了技术支撑。
猫头虎
21 小时前
microsoft
·
ai
·
pdf
·
aigc
·
ocr
·
ai编程
·
ai-native
猫头虎AI分享:无需OCR,基于ColQwen2、Qwen2.5和Weaviate对PDF进行多模态RAG的解决方案
关键词:多模态RAG、ColQwen2、Qwen2.5-VL、Weaviate 向量数据库、PDF 检索问答、无需 OCR、ColBERT 多向量、跨模态检索、MaxSim 相似度、知识库构建、AI 文档处理、视觉语言模型、晚交互(Late Interaction)、向量索引、Python 教程、HuggingFace、Colab、MPS、GPU
喜欢吃豆
3 天前
人工智能
·
算法
·
语言模型
·
自然语言处理
·
大模型
·
ocr
从像素到篇章:深入剖析光学字符识别(OCR)的技术原理
想象这样的场景:用手机扫描购物小票,应用自动提取金额与商品信息填入报销单;在海量PDF档案库中搜索关键词,系统几秒内定位到包含该词的扫描页面。这些“神奇”操作的背后,是核心技术——光学字符识别(Optical Character Recognition, OCR)。它如同赋予机器“阅读”的眼睛,将图像中的文字转化为可编辑、可搜索的计算机文本。
AI人工智能+
7 天前
人工智能
·
nlp
·
ocr
·
竣工验收备案识别
竣工验收备案识别技术:通过AI和OCR实现智能化文档处理,提升效率与准确性,推动建筑行业数字化转型。
竣工验收备案是建设工程项目投入使用的最终法定程序,是确保工程符合规划、质量、消防、环保等各项要求的核心关口。传统的备案流程依赖大量纸质文档和人工审核,效率低下且易出错。随着人工智能与大数据技术的崛起,竣工验收备案识别技术应运而生,正深刻地变革着这一传统领域,为建筑行业的数字化转型提供关键动力。
df007df
7 天前
人工智能
·
ocr
·
embedding
·
llama
【RAGFlow代码详解-10】文本处理和查询处理
文本处理和查询处理系统将自然语言查询转换为与 RAGFlow 的文档存储后端配合使用的优化搜索表达式。该系统支持中英文文本处理,具有专门的标记化、术语加权和查询增强技术。
AI人工智能+
13 天前
人工智能
·
深度学习
·
ocr
·
表格识别
表格识别技术:通过图像处理与深度学习,将非结构化表格转化为可编辑结构化数据,推动智能化发展
在信息爆炸的时代,大量有价值的数据并非存储于结构化的数据库中,而是隐藏在成千上万的文档、报告和票据的表格里。从金融报表到医疗档案,从物流单据到学术论文,表格是承载结构化信息的核心载体。如何高效、准确地将这些非结构化的表格图像转化为可编辑、可分析的结构化数据,正是表格识别(Table Recognition)技术的用武之地。它不仅是一项技术革新,更是一场提升各行各业智能化水平的效率革命。
Virgil139
14 天前
人工智能
·
pytorch
·
计算机视觉
·
自然语言处理
·
ocr
·
transformer
【TrOCR】模型预训练权重各个文件解读
huggingface上预训练权重trocr-base-printed 下载后的trocr-base-printed是一个文件夹,结构如下:
EkihzniY
15 天前
大数据
·
ocr
结构化 OCR 技术:破解各类检测报告信息提取难题
各类检测报告(如医疗检验、产品质检、环境监测等)格式多样、信息密集,传统人工录入效率低且易出错,结构化 OCR 技术成为高效解决方案。
AI人工智能+
15 天前
人工智能
·
自动化
·
ocr
·
施工许可证识别
一种融合AI与OCR的施工许可证识别技术,提升工程监管效率,实现自动化、精准化处理。
在数字化转型浪潮中,建筑行业正朝着智能化、精细化的方向飞速发展。作为项目建设合法性的“准生证”,施工许可证是工程监管、信贷融资、流程审批的核心凭证。传统依赖人工肉眼核验、手动录入信息的方式,效率低下、易出错且难以追溯,已成为制约行业效率的瓶颈。施工许可证识别技术应运而生,通过人工智能与OCR(光学字符识别)的深度融合,为这一痛点提供了高效的自动化解决方案
抠头专注python环境配置
16 天前
python
·
ocr
·
conda
OCR库pytesseract安装保姆级教程
本文将介绍使用工具安装OCR库pytesseract的详细流程。Anaconda安装教程参考Anaconda安装保姆级教程。
熊猫钓鱼>_>
18 天前
ocr
深入解析 Monkey OCR:本地化、多语言文本识别的利器与实践指南
在信息爆炸的时代,从图片、扫描文档中高效提取结构化文本的需求日益迫切。OCR(光学字符识别)技术成为解决这一问题的核心工具。尽管市面上有 Abbyy FineReader、Adobe Acrobat 等商业巨头,以及 Tesseract、PaddleOCR 等开源方案,但追求极致本地化、轻量化、多语言支持且完全免费的用户往往难以找到完美选择。今天,我们将聚焦一个冉冉升起的新星 - Monkey OCR,深入剖析其优势,并提供一份详尽的实战教程与经验分享。
代码AI弗森
19 天前
pdf
·
ocr
PDF OCR + 大模型:让文档理解不止停留在识字
在企业数字化的实际场景中,PDF OCR 已经很普遍了:从扫描件提取文本、表格到生成可搜索 PDF。但这类技术往往停留在"把图片变成文字",对文档背后的语义、逻辑、业务价值理解不足。
AI人工智能+
21 天前
人工智能
·
ocr
·
银行卡识别
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
在移动支付普及、金融业务线上化的浪潮下,银行卡识别技术已成为连接实体卡片与数字世界的关键桥梁。它利用人工智能与图像处理技术,让冰冷的塑料卡片瞬间“开口说话”,实现高效、准确的信息录入与管理。
deephub
22 天前
人工智能
·
深度学习
·
神经网络
·
ocr
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
在传统OCR技术日趋成熟的今天,一个仅有1.7B参数的视觉语言模型正在重新定义文档处理的技术边界。Dots.ocr的出现标志着OCR领域从传统多模块流水线向统一视觉语言建模的重要转变,其在多项基准测试中超越大参数模型的表现,预示着"小而精"可能比"大而全"更具实用价值。
ccut 第一混
23 天前
c#
·
ocr
·
halcon
c#联合Halcon进行OCR字符识别(含halcon-25.05 百度网盘)
通过网盘分享的文件:halcon-25.05.0.0-x64-win64 链接: https://pan.baidu.com/s/1XAx-8ZQM-ZHkgHIc-dhCYw
R-G-B
25 天前
c++
·
opencv
·
ocr
·
发票精准定位
·
提取指定单元格数据
·
倾角计算
·
旋转矫正
【04】OpenCV C++实战篇——实战:发票精准定位,提取指定单元格数据。(倾角计算、旋转矫正、产品定位、目标定位、OCR文字提取)
用户需求描述:1.自动拍照: 工作台垂直方向安装一对红外对管,当品票放置在工作台上,红外对管被遮挡触发自动拍照及后续自动识别工作; 2.旋转矫正: 使图片水平; 3.产品定位: 确定一个定位点,每张图片都固定在相同的位置: 4.目标ROI: 以定位点为参考点确定n个目标提取位置的坐标,截取ROI; 4.文字提取: OCR文字提取;
EkihzniY
1 个月前
pdf
·
ocr
单层 PDF 与双层 PDF:一字之差,功能大不同
日常接触的 PDF 文档,看似相似却分 “单层” 与 “双层”,核心区别在于是否包含可编辑的文本层。单层 PDF本质是 “图片包裹体”,文字以像素形式存在(如扫描生成的文件)。它像一张纸质文档的照片,无法直接复制、搜索或修改文字,必须借助 OCR 技术识别后才能提取内容。
郭庆汝
1 个月前
ocr
本地服务器端部署基于大模型的通用OCR项目——dots.ocr
dots.ocr 是一个强大的多语言文档解析器,它在一个单一的视觉-语言模型中统一了布局检测和内容识别,同时保持良好的阅读顺序。尽管其基础是紧凑的1.7B参数LLM,但它实现了最先进的(SOTA)性能。
EkihzniY
1 个月前
ocr
OCR 精准识别验讫章:让登记与校验更智能
验讫章作为通关、办公等场景的重要凭证,其识别与登记曾依赖人工核对,效率低且易出错。OCR 技术的介入,让这一过程实现了自动化升级。