ocr

AI人工智能+2 天前
深度学习·ocr·食品经营许可证识别
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?在食品流通与餐饮服务行业,食品经营许可证是企业合法经营的重要凭证。无论是线上外卖平台对入驻商家的资质审核,还是线下市场监管部门的日常巡检,都需要快速、准确地核验许可证信息。传统的人工录入方式不仅效率低下,且容易出错,难以满足大规模、高频次的审核需求。针对这一痛点,一种基于深度学习的食品经营许可证识别技术应运而生,以高精度OCR为核心,实现秒级关键信息提取,为食品安全监管和商业合规化提供了智能化的解决方案。
摆烂小白敲代码2 天前
大数据·人工智能·经验分享·ocr·腾讯云
腾讯云智能结构化OCR在物流行业的应用声明:本篇博客为腾讯云智能结构化OCR体验文章,非广告目录物流行业的痛点与需求腾讯云智能结构化OCR技术概述
开开心心就好6 天前
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
免费音频转文字工具,绿色版离线多模型可用软件介绍这款叫 音频转文字工具 的软件,是作者专门开发的。之前推荐过不少音频转文字工具,市面上也有类似的,但好多要收费,所以用这个免费的不香吗?
开开心心_Every7 天前
linux·运维·服务器·pdf·ocr·测试用例·模块测试
全屏程序切换工具,激活选中窗口快速切换软件介绍今天给大伙儿安利个小众但特管用的工具,它叫 Windows选择窗口激活器。专门解决那种全屏程序(尤其是游戏)卡住没法切换的破事儿,关键时刻能救急!
2401_836235867 天前
人工智能·科技·深度学习·ocr
名片识别产品:技术要点与应用场景深度解析一、 核心技术要点:从“看见”到“理解”名片识别并非简单的拍照存图,而是一个融合了计算机视觉、自然语言处理与深度学习的复杂系统工程。其技术要点可拆解为以下四个核心环节:
njsgcs9 天前
ocr
glm-ocr ollama使用 pythonglm-ocr
开开心心就好9 天前
人工智能·windows·物联网·计算机视觉·计算机外设·ocr·excel
轻松鼠标连, 自定义区域模仿人手点击软件介绍这款软件叫 景好鼠标连点器,是个专门搞鼠标连点的小工具。我用了一阵子,真心觉得顺手,比那些普通连点器靠谱多了。
littleshimmer9 天前
ocr
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)SnapOCR 是一款基于 C++ 开发的轻量级桌面 OCR(Optical Character Recognition,光学字符识别)工具,支持快速截屏识别与图片识别,专注于本地化、高效率与数据安全。
AI周红伟11 天前
大数据·人工智能·大模型·ocr·智能体·seedance
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建github地址:https://github.com/deepseek-ai/DeepSeek-OCR-2
kongba00713 天前
大数据·ocr
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。基于您提供的 Python 脚本,该项目实现了一个从图片/文档识别到结构化数据输出的全自动化流水线。以下是该项目的工作流、技术栈及工程化经验总结:
gzroy13 天前
ocr·paddle
华为昇腾服务器部署Paddle OCR VL模型及推理服务Paddle OCR VL 1.5是百度飞桨推出的0.9B超紧凑多模态文档解析模型,其核心特色包括:全球首个支持异形框定位,能精准处理倾斜、弯折、拍照畸变等真实场景;在OmniDocBench v1.5评测中达到94.5%高精度;集成文本定位、印章识别、表格解析等多任务一体化能力。
jialan7515 天前
ocr
GLM-ocr测试test_simple.py 是一个简化的 OCR 识别测试脚本,用于测试 GLM-OCR 模型对图片的识别性能。
含老司开挖掘机15 天前
ocr·文档解析·结构化输出·chandra
Chandra OCR多格式输出详解:同页同步生成Markdown/HTML/JSON三版本你有没有遇到过这样的场景:Chandra 就是为解决这些“排版失真”痛点而生的。它不是把图片当文字流来识别,而是像人一样“看懂页面”:哪是标题、哪是正文、哪是两栏布局、哪是嵌套表格、哪是手写批注、哪是LaTeX公式——然后原样还原成结构化输出。
Cccp.12316 天前
人工智能·opencv·ocr
【OpenCV】(十八)答题卡识别判卷与文档ocr扫描识别系列内容:OpenCV概述与环境配置,OpenCV基础知识和绘制图形,图像的算数与位运算,图像视频的加载和显示,图像基本变换,滤波器,形态学,图像轮廓,图像直方图,车辆统计项目,特征检测和匹配,图像查找和拼接,虚拟计算器项目,信用卡识别项目,图像的分割与修复,人脸检测与车牌识别,目标追踪,答题卡识别判卷与文档ocr扫描识别,光流估计
合合技术团队16 天前
ocr·coze·文档解析·textln
零代码搭建「招标文件解析智能体」:Coze+TextIn xParse实现PDF上传自动提条款、标风险、出建议如果你参与过招投标,一定理解这种挑战:200-500 页起步:包含目录、征文、技术规范、商务条款、复杂表格和各类附件。
御坂10101号17 天前
图像处理·pdf·ocr
爱泼斯坦文件技术细节:伪扫描、元数据清洗与撤销涂黑最近关于爱泼斯坦文件的讨论闹得沸沸扬扬,尤其是社交媒体上盛传所谓的「撤销涂黑就能看到机密」的技术揭秘。但如果你真的去翻看那份著名的 PDF 技术分析报告,会发现事实既没那么乌龙,也没那么无趣。
2401_8362358618 天前
人工智能·科技·深度学习·ocr·生活
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因一份模糊泛黄的历史合同,在几秒内被精准识别、分类归档,并转化为可任意检索的电子数据——这不是科幻场景,而是正在发生的企业档案管理革命。
2401_8362358619 天前
人工智能·科技·深度学习·ocr·生活
财务报表识别产品:从“数据搬运”到“智能决策”的技术革命在数字经济时代,数据已成为企业最核心的资产之一。对于财务、审计、投资及监管机构而言,财务报表是洞察企业经营状况、评估投资价值、防范金融风险的关键依据。然而,传统的财务报表处理方式——人工录入、核对、汇总——不仅耗时耗力,且极易因疲劳或疏忽导致数据错误,成为企业数字化转型的“最后一公里”障碍。
A小码哥20 天前
ocr
DeepSeek-OCR-2 开源 OCR 模型的技术OCR应用的场景和类型很广,本次使用Qwen2的架构,解决看的全(扫码方式优化)、看的的准(内容识别、视觉标记、降低重复率),多裁剪策略提取核心信息。和其他OCR模型项目还是看自己的引用场景,通用场景还是建议使用最新的模型,识别准、理解准、排版准。