OCR — 图片 OCR 识别与智能匹配工具

OCR --- 图片 OCR 识别与智能匹配工具

简洁版网页工具,支持将两组图片(A 为模板、B 为待重命名)进行 OCR 识别、智能匹配与一键下载重命名结果。


功能概览

  • 文件导入: A/B 两组各自选择或拖拽导入,支持多次追加与单张删除。
  • OCR 识别: 仅识别未识别/失败项;并发度 2;内置全局 QPS 限制(默认 2,可调 1--10)与网络/限流重试。
  • 智能匹配与重命名 :
    • 仅匹配与 A 尺寸一致的 B;
    • 文本相似度≥阈值(0--1,默认 0.5)才算匹配;
    • 支持手动匹配与冲突处理(同名冲突会回退冲突 B 并标记 unmatched)。
  • 下载: 批量单张下载或打包 ZIP 下载。
  • 可视化: 网格预览、OCR 文本、分辨率、匹配状态、统计面板与大图预览。

目录结构

  • index.html:当前主版本(推荐)。
  • ocrplus.html:旧版增强页面(保留,仅作备用)。
  • image.pngindex.html 截图。
  • ocrplus.pngocrplus.html 截图。
  • LICENSE:MIT 许可。

快速开始

  1. 准备后端(本地 Node 代理,转发到百度 OCR):
powershell 复制代码
node server.js
  • 默认地址:http://localhost:3000/ocr(或 http://0.0.0.0:3000/ocr)。
  • server.js 内配置你的百度 OCR API Key(每个账户有免费额度)。
  1. 打开前端:
  • 直接双击 index.html 用浏览器打开。
  • 按页面提示导入 A/B 两组图片,点击"开始识别并自动匹配"。
  1. 可选:下载结果
  • 使用"批量单张下载"或"批量 ZIP 下载"。

API 说明(代理服务)

  • POST /ocr
    • Request

      json 复制代码
      { "imageBase64": "..." }
    • Response(示例)

      json 复制代码
      { "words_result": [ { "words": "...", "probability": 0.9 } ] }

注意:API Key 为私密信息,请勿提交到公共仓库。


旧版 OCRPlus(保留说明)

ocrplus.html 为早期的增强版页面,包含"格式转换与下载"整套流程:

主要差异:

  • 增加了格式转换面板(JPG/PNG/WebP/AVIF/ICO 等,质量可调,重命名规则可选)。
  • OCR 流程以顺序进度条呈现;不包含主版的阈值/QPS滑块。
  • 手动匹配同样要求尺寸一致;提供结果列表与 ZIP 打包下载。

该页面已停止日常维护,建议优先使用 index.html 主版。


常见问题(FAQ)

  • 无法识别/报 QPS 限制?
    • 稍等片刻自动重试;或在主版页面降低 QPS 滑块值。
  • 相似度阈值怎么调?
    • 识别完成后可拖动滑块,系统会保留手动匹配并重新计算自动匹配。
  • 一张 A 被多个 B 匹配怎么办?
    • 内置去重策略:同名冲突时会回退冲突 B,并给出提示。

github

链接地址 https://github.com/regtet/OCR

许可证

本项目使用 MIT License,详见 LICENSE

相关推荐
AI人工智能+13 天前
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?
深度学习·ocr·食品经营许可证识别
摆烂小白敲代码14 天前
腾讯云智能结构化OCR在物流行业的应用
大数据·人工智能·经验分享·ocr·腾讯云
开开心心就好17 天前
免费音频转文字工具,绿色版离线多模型可用
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
开开心心_Every18 天前
全屏程序切换工具,激活选中窗口快速切换
linux·运维·服务器·pdf·ocr·测试用例·模块测试
2401_8362358619 天前
名片识别产品:技术要点与应用场景深度解析
人工智能·科技·深度学习·ocr
njsgcs20 天前
glm-ocr ollama使用 python
ocr
开开心心就好20 天前
轻松鼠标连, 自定义区域模仿人手点击
人工智能·windows·物联网·计算机视觉·计算机外设·ocr·excel
littleshimmer20 天前
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)
ocr
AI周红伟22 天前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建
大数据·人工智能·大模型·ocr·智能体·seedance
kongba00724 天前
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。
大数据·ocr