36k Star 的 OCR 前端 SDK 轻松上手图像识别

什么是图像 OCR 技术

大家平时在处理图片的时候,有没有遇到过需要把图片里的文字提取出来的情况?比如一些扫描的文档、拍下来的菜单或者街上的广告牌照片。要是能直接把这些文字"读"出来,是不是方便很多?这就是图像 OCR(光学字符识别)技术能干的事儿。

它就像给程序装上了一双能看懂文字的"眼睛",不管文字在图片里还是文档扫描件里,都能被识别出来,然后转化成我们可以编辑、搜索的文本格式。听起来是不是很神奇?

基于图像 OCR 的开源方案分享

今天就给大家分享一个超厉害的开源项目------Tesseract.js。

它是什么

Tesseract.js 是一个用 JavaScript 写的库,能从图片里提取出各种语言的文字。不管是浏览器环境还是服务器环境,它都能轻松应对。是不是很厉害?

怎么用

如果你要在网页里用,最简单的方法就是用 CDN 引入:

xml 复制代码
<!-- v5 版本 -->
<script src='<https://cdn.jsdelivr.net/npm/tesseract.js@5/dist/tesseract.min.js>'></script>

然后,你就能用 Tesseract.createWorker 来创建一个工作线程,开始你的文字识别之旅啦。

或者,如果你喜欢用 import 语法,可以去 https://cdn.jsdelivr.net/npm/tesseract.js@5/dist/tesseract.esm.min.js 拿到 ESM 构建。

如果你想在 Node.js 项目里用,得先安装它。用 npm 或 yarn 都行:

csharp 复制代码
# 最新版本
npm install tesseract.js
yarn add tesseract.js

# 旧版本
npm install tesseract.js@3.0.3
yarn add tesseract.js@3.0.3

使用方法

安装好之后,用起来也很简单。比如,你想从一张图片里提取英文文字,可以这样写:

ini 复制代码
import { createWorker } from 'tesseract.js';

(async () => {
  const worker = await createWorker('eng');
  const ret = await worker.recognize('<https://tesseract.projectnaptha.com/img/eng_bw.png>');
  console.log(ret.data.text);
  await worker.terminate();
})();

要是你有很多图片要处理,记得先创建一个工作线程,然后对每个图片都运行 worker.recognize,最后再运行 worker.terminate(),这样效率更高。

它能干啥

Tesseract.js 的目标是把 Tesseract OCR 引擎(一个很厉害的独立项目)带到浏览器和 Node.js 里。它通过包装 Tesseract 的 WebAssembly 端口来实现。注意哦,它不修改 Tesseract 的核心功能,所以有些限制,比如 不支持 PDF 文件,也不会去改 Tesseract 的识别模型来提高准确率。

如果你的项目需要一些超出它能力的功能,比如从 PDF 里提取文字,可以看看 Scribe.js,它是个替代方案,专门用来满足这些额外需求。

官方Demo

图像识别:

视频实时识别:

最后

交个朋友 [撇嘴] ,私发9 。获取 Tesseract.js 链接

相关推荐
一只小阿乐16 小时前
vue3封装alert 提示组件 仿element-plus
前端·javascript·vue.js·vue3
IT_陈寒16 小时前
SpringBoot实战避坑指南:我在微服务项目中总结的12条高效开发经验
前端·人工智能·后端
华洛16 小时前
解读麦肯锡报告:Agent落地的六大经验教训
前端·javascript·产品经理
艾小码16 小时前
还在重复造轮子?掌握这7个原则,让你的Vue组件复用性飙升!
前端·javascript·vue.js
探索宇宙真理.16 小时前
React Native Community CLI命令执行 | CVE-2025-11953 复现&研究
javascript·经验分享·react native·react.js·安全漏洞
QT 小鲜肉16 小时前
【Git、GitHub、Gitee】GitLab的概念、注册流程、远程仓库操作以及高级功能详解(超详细)
git·qt·gitee·gitlab·github
. . . . .17 小时前
React底层原理
javascript·react.js
2401_8315017317 小时前
Web网页之前端三剑客汇总篇(基础版)
前端
CozyOct118 小时前
⚡️2025-11-10GitHub日榜Top5|AI黑客漏洞发现工具
github
木易 士心18 小时前
Vue 3 Props 响应式深度解析:从原理到最佳实践
前端·javascript·vue.js