electron本地OCR实现

使用tesseract.js - npm (npmjs.com)

官方demo:GitHub - Balearica/tesseract.js-electron: An example to use tesseract.js in electron

目录结构:

javascript 复制代码
// 引入
<script type="module" src="./ocr/tesseract.js"></script>

// 使用
async function ocr() {
    const worker = await Tesseract.createWorker("chi_sim", 1, {
      workerPath: "./ocr/worker.js", langPath: "./lang-data", corePath: "tesseract-core.wasm.js", logger: m => console.log(m), gzip: true,
      workerBlobURL: false
    });
    const ret = await worker.recognize('./images/test.png');
    console.log(ret.data.text);
    alert(ret.data.text);
    await worker.terminate();
  }

需要注意的地方:

1. 三个文件都可以npm install tesseract.js后在node_modules中找到

2. 语言包下载地址: tessdata/4.0.0_best/chi_sim.traineddata.gz at gh-pages · naptha/tessdata · GitHub

3. langPath与corePath的文件位置都是基于workerPath的相对路径

4. workerBlobURL要写false

5. 语言包若未经过解压gzip写true

相关推荐
竹林81830 分钟前
从零到一:我在Solana NFT铸造前端中搞定@solana/web3.js连接与交易
前端·javascript
尘世中一位迷途小书童36 分钟前
前端工程化基石:package.json 40+ 字段逐一拆解
前端·javascript·架构
酉鬼女又兒1 小时前
零基础快速入门前端JavaScript四大核心内置对象:Math、Date、String、Array全解析(可用于备赛蓝桥杯Web应用开发)
前端·javascript·css·蓝桥杯·前端框架·js
__sgf__1 小时前
ES11(ES2020)新特性
前端·javascript
__sgf__1 小时前
ES8(ES2017)新特性
前端·javascript
__sgf__1 小时前
ES9(ES2018)新特性
前端·javascript
你挚爱的强哥1 小时前
解决:动态文本和背景色一致导致文字看不清楚,用js获取背景图片主色调,并获取对比度最大的hex色值给文字
前端·javascript·github
英俊潇洒美少年1 小时前
js 同步异步,宏任务微任务的关系
开发语言·javascript·ecmascript
angerdream1 小时前
最新版vue3+TypeScript开发入门到实战教程之路由详解
前端·javascript·vue.js
小贺要学前端2 小时前
ES6 还没用明白,JavaScript 已经快到 ES2026 了
前端·javascript·es6