基于JSON的数据捕获用领域特定语言

领域特定语言(DSL)是一种针对特定类型问题的计算机语言。DSL的例子包括CSS、SQL、make等。

Martin Fowler对内部DSL和外部DSL进行了定义和区分。内部DSL是使用宿主语言的特殊方式,可以让宿主语言具有特殊的用法,比如 Jetpack Compose。外部DSL有自己的自定义语法,可以编写一个完整的解析器来处理它们,比如JSON和XML。

Dynamsoft Capture Vision是一个数据捕获框架,旨在轻松扫描文档、读取条形码和识别文本。其主要特点之一是,我们可以使用基于JSON的DSL来配置数据捕获任务。在本文中,我们将介绍这个DSL。

不使用DSL和使用DSL

让我们首先讨论下不使用DSL和使用DSL的用法。

假设我们要扫描下图中的文档并读取条形码:

我们可以使用Dynamsoft Document NormalizerDynamsoft Barcode Reader来执行此任务。这两个SDK支持各种平台,如iOS、Android、桌面和Web。这里,我们使用Web的JavaScript版本:

js 复制代码
let documentNormalizer = await Dynamsoft.DDN.DocumentNormalizer.createInstance(); //requires Dynamsoft Document Normalizer version 1.x
let barcodeReader = await Dynamsoft.DBR.BarcodeReader.createInstance(); //requires Dynamsoft Barcode Reader version 9.x
let img = document.getElementById("image");
let quads = await documentNormalizer.detectQuad(img);
let normalizedImageResult = await documentNormalizer.normalize(img, {
  quad: quads[0].location
});
let normalizedImageAsCanvas = normalizedImageResult.image.toCanvas();
let barcodeResults = await barcodeReader.decode(normalizedImageAsCanvas);

Dynamsoft Capture Vision可以作为一个中间程序调用Dynamsoft Document Normalizer和Dynamsoft Barcode Reader以得到相同的结果。

首先,我们需要在JSON DSL中定义任务。

  1. 定义条形码读取任务和文档扫描任务。

    json 复制代码
    {
      "BarcodeReaderTaskSettingOptions": [
        {
          "Name": "task-read-barcodes"
        }
      ],
      "DocumentNormalizerTaskSettingOptions": [
        {
          "Name": "task-detect-and-normalize-document"
        }
      ]
    }
  2. 定义两个目标ROI :用于文档扫描的全图像ROI和基于检测到的文档图像的条形码读取ROI。

    json 复制代码
    {
      "TargetROIDefOptions": [
        {
          "Name": "roi-detect-and-normalize-document",
          "TaskSettingNameArray": ["task-detect-and-normalize-document"]
        },
        {
          "Name": "roi-read-barcodes",
          "TaskSettingNameArray": ["task-read-barcodes"],
          "Location":
          {
            "ReferenceObjectFilter" : {
              "ReferenceTargetROIDefNameArray": ["roi-detect-and-normalize-document"]
            }
          }
        }
      ]
    }

    注意:如果未设置Location,则ROI为整个图像。

  3. 定义一个名为ScanDocumentAndReadBarcode的模板,该模板使用上一步定义的两个目标ROI进行处理。

    json 复制代码
    {
      "CaptureVisionTemplates": [
        {
          "Name": "ScanDocumentAndReadBarcode",
          "ImageROIProcessingNameArray": [
            "roi-detect-and-normalize-document","roi-read-barcodes"
          ]
        }
      ]
    }

将JSON保存为template.json文件。然后,我们可以使用以下JavaScript代码执行文档扫描和条形码读取任务:

js 复制代码
let router = await Dynamsoft.CVR.CaptureVisionRouter.createInstance();
let response = await fetch("./template.json");
let settings = await response.text();
await router.initSettings(settings);
let results = await router.capture(document.getElementById("image"),"ScanDocumentAndReadBarcode");

我们可以使用JSON DSL做更多的事情,例如设置图像处理参数,指定要使用的条形码格式等。可以在文档中了解相关信息。

PS:Dynamsoft Capture Vision需要Dynamsoft Document Normalizer v2+和Dynamsoft Barcode Reader v10+。

优点和缺点

在Dynamsoft Capture Vision中使用基于JSON的DSL有一些优点和缺点:

优点:

  • 数据捕获逻辑可以在不同平台之间共享,无需编写特定于平台的代码。
  • 图像处理结果可以在内部共享,以提高性能。例如,我们不需要重复将图像读取为字节或将图像转换为灰度的操作。
  • 领域专家可以比使用通用编程语言更有效地解决特定任务。

缺点:

  • 有一个学习曲线。
  • 设计和维护DSL是一项额外成本。
  • 使用宿主语言修改设置并不容易。这在交互式场景中通常是必要的,例如在裁剪之前修改扫描文档的边界。

为了克服这些缺点, Dynamsoft Capture Vision做了以下工作:

  1. 用于修改设置的编程接口: SimplifiedCaptureVisionSettings
  2. 帮助您学习的详细文档

源代码

可以在以下仓库中找到Dynamsoft Capture Vision的demo代码:github.com/tony-xlh/dy...

相关推荐
Rysxt_11 分钟前
Vuex 教程 从入门到实践
前端·javascript·vue.js
xuehuayu.cn1 小时前
js es6 class 类中的值是异步赋值, 子类中如何获取这个值?
javascript·es6
威风的虫1 小时前
ES6 数组方法:告别循环,拥抱函数式编程
开发语言·前端·javascript
小杨快跑~1 小时前
ES6 Promise:告别回调地狱的异步编程革命
前端·javascript·ecmascript·es6
r0ad2 小时前
读诗的时候我却使用了自己研发的Chrome元素截图插件
前端·javascript·chrome
知识分享小能手3 小时前
jQuery 入门学习教程,从入门到精通, jQuery在HTML5中的应用(16)
前端·javascript·学习·ui·jquery·html5·1024程序员节
七号练习生.c3 小时前
JavaScript基础入门
开发语言·javascript·ecmascript
baozj3 小时前
🚀 手动改 500 个文件?不存在的!我用 AST 撸了个 Vue 国际化神器
前端·javascript·vue.js
今天没有盐4 小时前
Pandas缺失值处理完全指南:从基础操作到高级技巧
python·pycharm·编程语言
molly cheung4 小时前
FetchAPI 请求流式数据 基本用法
javascript·fetch·请求取消·流式·流式数据·流式请求取消