纯前端实现图文识别 OCR

Tesseract.js

Tesseract.js 是一个基于 Google Tesseract OCR 引擎的 JavaScript 库,利用 WebAssembly 技术将的 OCR 引擎带到了浏览器中。它完全运行在客户端,无需依赖服务器,适合处理中小型图片的文字识别。

基本使用

以下示例展示了如何使用 Tesseract.js 从图片中提取文字:

demo

HTML单文件:

javascript 复制代码
<!DOCTYPE html>
<html lang="en">
  <head>
    <meta charset="UTF-8">
    <title>OCR 图文识别</title>
    <!-- <script src="https://unpkg.com/tesseract.js@2.1.1/dist/tesseract.min.js"></script> -->
    <script src="https://unpkg.com/tesseract.js@v2.1.0/dist/tesseract.min.js"></script>
  </head>
  <body>
    <h1>OCR 图文识别</h1>
    <input type="file" id="imageFile" accept="image/*" />
    <br />
    <button onclick="recognizeImg()">识别图像</button>
    <br />
    <h2>识别结果:</h2>
    <div id="result">???</div>

    <script>
      const worker = Tesseract.createWorker({
        logger: function (m) {
          console.log(m);
        },
      });

      async function recognizeImg() {
        const fileInput = document.getElementById("imageFile");
        const selectedFile = fileInput.files[0];
        console.log(selectedFile);
        await worker.load();
        await worker.loadLanguage(["eng", "chi_sim"]);
        await worker.initialize(["eng", "chi_sim"]);

        const ret = await worker.recognize(selectedFile||'https://tesseract.projectnaptha.com/img/eng_bw.png');
        console.log(ret.data.text);
        handleOCRResponse(ret.data);

        // 或者使用 FileReader方式
        // handleFileFn(selectedFile);
      }

      function handleFileFn(file) {
        // 使用 FileReader 读取图像文件内容
        const reader = new FileReader();
        reader.onload = function (e) {
          const imageDataURL = e.target.result;
          // 上传图像文件至 OCR API
          uploadImageToOCR(imageDataURL);
        };
        reader.readAsDataURL(file);
      }

      async function uploadImageToOCR(imageDataURL) {
        await worker.load();
        await worker.loadLanguage(["eng", "chi_sim"]);
        await worker.initialize(["eng", "chi_sim"]);
        const ret = await worker.recognize(imageDataURL);
        console.log(ret.data.text);
        if (ret.data) {
          handleOCRResponse(ret.data);
        }
      }

      function handleOCRResponse(data) {
        const resultDiv = document.getElementById("result");

        if (data && data.text) {
          resultDiv.textContent = data.text;
        } else {
          resultDiv.textContent = "未能识别文本。";
        }
      }
    </script>
  </body>
</html>

demo in react:github-demo

相关推荐
xiaotao1311 小时前
第九章:Vite API 参考手册
前端·vite·前端打包
午安~婉1 小时前
Electron桌面应用聊天(续)
前端·javascript·electron
彧翎Pro1 小时前
基于 RO1 noetic 配置 robosense Helios 32(速腾) & xsense mti 300
前端·jvm
小码哥_常2 小时前
解锁系统设置新姿势:Activity嵌入全解析
前端
之歆2 小时前
前端存储方案对比:Cookie-Session-LocalStorage-IndexedDB
前端
哟哟耶耶2 小时前
vue3-单文件组件css功能(:deep,:slotted,:global,useCssModule,v-bind)
前端·javascript·css
是罐装可乐2 小时前
深入理解“句柄(Handle)“:从浏览器安全到文件系统访问
前端·javascript·安全
AI人工智能+2 小时前
基于高精度身份证OCR识别、炫彩活体检测及人脸比对技术的人脸核身系统,为通信行业数字化转型提供了坚实的安全底座
人工智能·计算机视觉·人脸识别·ocr·人脸核身
AI人工智能+2 小时前
一种以深度学习与计算机视觉技术为核心的表格识别系统,实现了结构化、半结构化表格的精准文字提取、布局解析与版面完整还原
深度学习·计算机视觉·ocr·表格识别
华科易迅2 小时前
Vue如何集成封装Axios
前端·javascript·vue.js