JS-OCR-demo加载本地文件

背景:

在了解 Tesseract 的识别效果的时候,有个demo项目很好用。有个小毛病,就是没事都要从摄像头抓取图片,然后进行识别。如果可以从本地读取图,就更方便了。

实现:

  1. 下载项目代码:https://github.com/kdzwinel/JS-OCR-demo

  2. 在页面index.html增加选择文件的input组件

    html 复制代码
    51|<input type="file" id="uploadImage" accept="image/*" class="btn btn-lg btn-default" style="justify-self: center;
        margin-top: 10px;">
  3. 在main.js修改方法:

  • 增加加载本地图片的逻辑。

    js 复制代码
       // 新增:本地图片上传
       $('#uploadImage').on('change', function (e) {
           var file = e.target.files[0];
           if (!file) return;
           var reader = new FileReader();
           reader.onload = function (evt) {
               var img = document.querySelector('#step2 img');
               img.onload = function () {
                   // 将图片绘制到canvas
                   var canvas = document.querySelector('#step2 canvas');
                   canvas.width = pictureWidth;
                   canvas.height = pictureHeight;
                   
                   var ctx = canvas.getContext('2d');
                   ctx.drawImage(img, 0, 0, canvas.width, canvas.height);
                   texture = fxCanvas.texture(canvas);
                   fxCanvas.draw(texture)
                       .hueSaturation(-1, -1)//grayscale
                       .unsharpMask(20, 2)
                       .brightnessContrast(0.2, 0.9)
                       .update();
                   $('.jcrop-holder img').attr('src', fxCanvas.toDataURL());
                   $(img).attr('src', fxCanvas.toDataURL());
               };
               img.src = evt.target.result;
           };
           reader.readAsDataURL(file);
           step2(false);
           changeStep(2);
           
       });
  • 修改step2方法:增加参数判断,区分使用的相机截图,还是本地文件;截图时,使用图片真实像素为基准。

    js 复制代码
    function step2(usevideo=true) {
        var canvas = document.querySelector('#step2 canvas');
        var img = document.querySelector('#step2 img');
        
        //setup canvas
        canvas.width = pictureWidth;
        canvas.height = pictureHeight;
    
        var ctx = canvas.getContext('2d');
    
        if(usevideo){
        //draw picture from video on canvas
        ctx.drawImage(video, 0, 0);
        console.log('draw picture from video on canvas');
        }
    
        //modify the picture using glfx.js filters
        texture = fxCanvas.texture(canvas);
        fxCanvas.draw(texture)
            .hueSaturation(-1, -1)//grayscale
            .unsharpMask(20, 2)
            .brightnessContrast(0.2, 0.9)
            .update();
    
        window.texture = texture;
        window.fxCanvas = fxCanvas;
    
        $(img)
            //setup the crop utility
            .one('load', function () {
                if (!$(img).data().Jcrop) {
                    $(img).Jcrop({
                        onSelect: function () {
                            //Enable the 'done' button
                            $('#adjust').removeAttr('disabled');
                        },
                        trueSize: [img.naturalWidth || img.width, img.naturalHeight || img.height]
                    });
                } else {
                    //update crop tool (it creates copies of <img> that we have to update manually)
                    $('.jcrop-holder img').attr('src', fxCanvas.toDataURL());
                }
            })
            //show output from glfx.js
            .attr('src', fxCanvas.toDataURL());
    }
  • 修改step3方法:截图区域不再使用缩放系数计算;修改识别语言为中文chi_sim

    js 复制代码
    function step3() {
            var canvas = document.querySelector('#step3 canvas');
            var step2Image = document.querySelector('#step2 img');
            var cropData = $(step2Image).data().Jcrop.tellSelect();
            
            // 直接使用裁剪区域的宽高
            canvas.width = cropData.w;
            canvas.height = cropData.h;
    
            var ctx = canvas.getContext('2d');
            ctx.drawImage(
                step2Image,
                cropData.x, cropData.y, cropData.w, cropData.h, // 源区域
                0, 0, cropData.w, cropData.h                    // 目标区域
            );
    
            var spinner = $('.spinner');
            spinner.show();
            $('blockquote p').text('');
            $('blockquote footer').text('');
            
            // do the OCR!
            // 设置参数
            var options = 'chi_sim+eng';
            Tesseract.recognize(ctx, options).then(function (result) {
                var resultText = result.text ? result.text.trim() : '';
    
                //show the result
                spinner.hide();
                $('blockquote p').html('&bdquo;' + resultText + '"');
                $('blockquote footer').text('(' + resultText.length + ' characters)');
            });
        }
相关推荐
JieE2123 小时前
LeetCode 101. 对称二叉树|JS 递归 + 迭代双解法,彻底搞懂镜像判断
javascript·算法
冬奇Lab5 小时前
AI Workflow 定义的四次演进:从 Markdown 到 JS 脚本,再到分布式多 Agent
javascript·人工智能·agent
一颗烂土豆11 小时前
Meshopt 压缩深度解析,为什么它比 Draco 更快
前端·javascript·webgl
kyriewen13 小时前
同事每天催我 Code Review,我写了个脚本让 AI 替我 review PR——现在他反过来催 AI 了
前端·javascript·ai编程
weedsfly16 小时前
迭代器、生成器与异步迭代——让数据“按需流动”的艺术
前端·javascript
假如让我当三天老蒯16 小时前
前端跨域解决方案(学习用)
前端·javascript·面试
铁皮饭盒18 小时前
Bun 哪比 Node.js 快?
javascript·后端
JieE2121 天前
LeetCode 56. 合并区间|超清晰 JS 图解思路,面试高频区间题
javascript·算法·面试
candyTong1 天前
RTK 技术原理:一次典型会话里,80% 上下文是怎么省下来的
javascript·后端·架构
_柳青杨1 天前
深入理解 JavaScript 事件循环
前端·javascript