技术栈
ocr
武子康
10 小时前
人工智能
·
深度学习
·
机器学习
·
ai
·
ocr
·
deepseek
·
deepseek-ocr
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
如果读者有一定深度学习或OCR领域背景,想学习并掌握DeepSeek-OCR,以下是建议的路径:Medium: DeepSeek-OCR is here
亚林瓜子
11 小时前
linux
·
运维
·
服务器
·
ocr
·
tesseract
·
amazon
·
fedor
在amazon linux 2023上面通过Fedora 36软件仓库源安装tesseract5
由于amazon linux 2023上面不能使用EPEL软件仓库源,所以,只能手动添加Fedora 36软件仓库源来安装tesseract。
PythonFun
1 天前
python
·
ocr
·
机器翻译
OCR图片识别翻译工具功能及源码
OCR图片识别翻译工具 二、软件简介:本软件主要解决用户在阅读外文图片、截图或界面文字时遇到的语言障碍痛点。通过智能OCR文字识别和精准翻译技术,实现一键截图翻译,大幅提升跨语言阅读效率,让语言不再成为信息获取的障碍。
用什么都重名
1 天前
人工智能
·
ocr
·
deepseek-ocr
DeepSeek-OCR 深度解析
DeepSeek团队最近开源的DeepSeek-OCR模型,给出了一个全新解法:把文本“画”成图像,用视觉Token实现高效压缩。原本需要1000个文本Token存储的内容,现在100个视觉Token就能搞定,还能保持97%的OCR精度。这种“光学压缩”思路,不仅让长文本处理效率飙升,更给大模型的“记忆机制”研究打开了新窗口。
lvnacp
1 天前
ocr
Qwen3-VL微调自定义OCR任务
使用自定义数据集微调Qwen/Qwen3-VL-2B-Instruct模型 1.使用autodl平台搭建系统环境 环境为 PyTorch 2.3.0 Python 3.12(ubuntu22.04) CUDA 12.1 2.下载模型
weixin_43798812
1 天前
ocr
信创模盒 ModelHub XC|高效适配最新国产全模态文字识别模型 DeepSeek-OCR
近日,范式信创模盒 ModelHub XC宣布,完成对最新国产全模态文字识别模型DeepSeek-OCR在信创算力卡上的适配测试,成为业内首批实现该创新OCR技术高效部署的平台。基于前期推出的面向信创算力的AI引擎体系EngineX的大模型推理框架,DeepSeek-OCR目前已经可以成功在昇腾、沐曦等芯片上稳定运行。
亚林瓜子
2 天前
java
·
spring boot
·
macos
·
ocr
·
lstm
·
tess4j
SpringBoot中使用tess4j进行OCR(在macos上面开发)
最近需要做OCR的实现,需要在Spring Boot工程中引入tess4j库,进行OCR识别。然后,这里使用macos m1进行开发。出现了找不到动态链接库的问题。主要就是找不到如下动态链接库:
咕咚-萌西
2 天前
人工智能
·
深度学习
·
ocr
DeepSeek-OCR
一、研究目的与核心思想 DeepSeek-OCR 是一次关于 “通过光学二维映射(optical 2D mapping)压缩长上下文” 的初步探索。它的目标是让模型能高效地从高分辨率输入中提取关键信息,把大量文本压缩成更少的视觉 token,从而实现高效的 OCR(光学字符识别)与长文本理解。
仙人掌_lz
3 天前
人工智能
·
ocr
·
文档解析
Hybrid OCR-LLM框架用于在大量复杂密集企业级文档信息提取
在文档解析过程中,你是否遇到过表单、证书或报告之类的大量结构相似内容文档?今天的文章提供了一些想法和见解。
翔云 OCR API
4 天前
人工智能
·
深度学习
·
ocr
基于深度学习与OCR研发的报关单识别接口技术解析
报关单识别接口研发背景:在当前全球贸易数字化进程加速的背景下,传统依赖人工录入的进出口报关流程已难以满足企业对效率、准确性和合规性的高标准要求。报关单识别接口,基于先进的OCR(光学字符识别)技术和深度学习算法,为海关进口/出口报关单的信息提取提供了高效、精准、安全的自动化解决方案,成为推动进出口企业实现数字化转型的关键技术引擎。
wwlsm_zql
4 天前
人工智能
·
ocr
DeepSeek-OCR:无损压缩新突破,解码精度高达97%
随着信息时代的迅猛发展,数据存储和传输的需求日益增长。特别是在文本信息处理领域,如何高效地进行压缩和解码成为了亟待解决的问题。近日,DeepSeek团队开源了其最新的DeepSeek-OCR模型,实现了文本信息无损压缩的突破性进展,即使在10倍压缩率下,解码精度仍高达97%。这一成果不仅为数据存储和传输提供了新的解决方案,也为大模型应用领域带来了新的可能性。
@解忧杂货铺
4 天前
ocr
百度ocr识别解决图形验证码登录问题
(1)、打开百度智能云网址进行注册:百度智能云-开工采购季 企业上云限时福利(2)、注册成功后一定要完成实名认证,这样才能获取到免费资源
FL1623863129
4 天前
人工智能
·
ocr
古籍影文公开古籍OCR检测数据集VOC格式共计8个文件
随着数字人文研究的深入,利用人工智能技术对古籍文献进行自动化处理与智能化分析已成为重要方向。其中,古籍OCR(光学字符识别)是核心环节,而高质量的数据集是训练和评估OCR模型的基础。在众多数据标注格式中,VOC(Visual Object Classes)格式因其结构清晰、信息丰富,在早期的计算机视觉任务中被广泛采用,同样也适用于古籍OCR数据集的构建。
CS创新实验室
4 天前
ai
·
大模型
·
llm
·
ocr
·
deepseek-ocr
【译文】DeepSeek-OCR:上下文光学压缩
来源:https://arxiv.org/pdf/2510.18234v1侯浩然、孙耀峰、李宇坤DeepSeek-AI
言慢行善
4 天前
ocr
OCR-图片内容识别
现有需求,一些数据暂时不方便直接读取或通过csv等文件导入数据库。只能以截图-图片/jpg形式发给业务,业务老师想直接上传图片后解析数据存到对应表中。
蛋王派
5 天前
人工智能
·
自然语言处理
·
pdf
·
ocr
本地部署DeepSeek-OCR:打造高效的PDF文字识别服务
告别繁琐的OCR配置,轻松构建企业级文档识别系统在文档数字化处理中,OCR(光学字符识别)技术扮演着至关重要的角色。今天我要分享的是如何快速部署和优化DeepSeek-OCR,将其封装成高效的API服务,实现PDF文档的智能解析。
短鼻子小象
5 天前
python
·
ai
·
ocr
DeepSeek-OCR:革命性文档识别模型全面解析及实测
DeepSeek再次引领技术革新!最新发布的OCR模型在文档识别效率上实现重大突破。本文将通过本地部署和客观实测,深入分析这款识别准确率高达97%、支持100+语言、每日可处理3300万页文档的开源大模型。
AI人工智能+
5 天前
人工智能
·
ocr
·
医疗器械经营许可证识别
医疗器械经营许可证识别技术通过OCR与AI技术实现资质信息自动提取,显著提升行业效率与合规管理水平
在医疗器械行业,合规是生命线。而《医疗器械经营许可证》则是企业进入市场、开展经营活动的核心“通行证”。随着数字化转型的深入,一种高效、精准的技术——医疗器械经营许可证识别技术应运而生,正深刻地改变着行业的运营模式和监管效率。
刘欣的博客
5 天前
ocr
·
dify ocr
·
ai 智能体工具
我的Dify OCR 识别发票准确率测试工具
RPA流程机器人项目上开始用Dify中的千问vl模型识别承兑票据,来帮助财务专员加快上账流程审批速度。在Dify中,我们有一个智能体,它只有很简单的一步,就是OCR识别,其实千问全量模型的识别率已经非常高了,但是为了做到100%的识别率和测试达成100%的识别率,我们需要不断优化这个智能体的提示词。这个过程是一个体力活,所以博主开发了批量测试工具来帮忙。
@解忧杂货铺
5 天前
ocr
【百度AI】Postman调用OCR服务-解决官方教程请求失败问题
百度官网教程-在线联调地址https://cloud.baidu.com/doc/OCR/s/1k3h7y3db