基于JSON的数据捕获用领域特定语言

领域特定语言(DSL)是一种针对特定类型问题的计算机语言。DSL的例子包括CSS、SQL、make等。

Martin Fowler对内部DSL和外部DSL进行了定义和区分。内部DSL是使用宿主语言的特殊方式,可以让宿主语言具有特殊的用法,比如 Jetpack Compose。外部DSL有自己的自定义语法,可以编写一个完整的解析器来处理它们,比如JSON和XML。

Dynamsoft Capture Vision是一个数据捕获框架,旨在轻松扫描文档、读取条形码和识别文本。其主要特点之一是,我们可以使用基于JSON的DSL来配置数据捕获任务。在本文中,我们将介绍这个DSL。

不使用DSL和使用DSL

让我们首先讨论下不使用DSL和使用DSL的用法。

假设我们要扫描下图中的文档并读取条形码:

我们可以使用Dynamsoft Document NormalizerDynamsoft Barcode Reader来执行此任务。这两个SDK支持各种平台,如iOS、Android、桌面和Web。这里,我们使用Web的JavaScript版本:

js 复制代码
let documentNormalizer = await Dynamsoft.DDN.DocumentNormalizer.createInstance(); //requires Dynamsoft Document Normalizer version 1.x
let barcodeReader = await Dynamsoft.DBR.BarcodeReader.createInstance(); //requires Dynamsoft Barcode Reader version 9.x
let img = document.getElementById("image");
let quads = await documentNormalizer.detectQuad(img);
let normalizedImageResult = await documentNormalizer.normalize(img, {
  quad: quads[0].location
});
let normalizedImageAsCanvas = normalizedImageResult.image.toCanvas();
let barcodeResults = await barcodeReader.decode(normalizedImageAsCanvas);

Dynamsoft Capture Vision可以作为一个中间程序调用Dynamsoft Document Normalizer和Dynamsoft Barcode Reader以得到相同的结果。

首先,我们需要在JSON DSL中定义任务。

  1. 定义条形码读取任务和文档扫描任务。

    json 复制代码
    {
      "BarcodeReaderTaskSettingOptions": [
        {
          "Name": "task-read-barcodes"
        }
      ],
      "DocumentNormalizerTaskSettingOptions": [
        {
          "Name": "task-detect-and-normalize-document"
        }
      ]
    }
  2. 定义两个目标ROI :用于文档扫描的全图像ROI和基于检测到的文档图像的条形码读取ROI。

    json 复制代码
    {
      "TargetROIDefOptions": [
        {
          "Name": "roi-detect-and-normalize-document",
          "TaskSettingNameArray": ["task-detect-and-normalize-document"]
        },
        {
          "Name": "roi-read-barcodes",
          "TaskSettingNameArray": ["task-read-barcodes"],
          "Location":
          {
            "ReferenceObjectFilter" : {
              "ReferenceTargetROIDefNameArray": ["roi-detect-and-normalize-document"]
            }
          }
        }
      ]
    }

    注意:如果未设置Location,则ROI为整个图像。

  3. 定义一个名为ScanDocumentAndReadBarcode的模板,该模板使用上一步定义的两个目标ROI进行处理。

    json 复制代码
    {
      "CaptureVisionTemplates": [
        {
          "Name": "ScanDocumentAndReadBarcode",
          "ImageROIProcessingNameArray": [
            "roi-detect-and-normalize-document","roi-read-barcodes"
          ]
        }
      ]
    }

将JSON保存为template.json文件。然后,我们可以使用以下JavaScript代码执行文档扫描和条形码读取任务:

js 复制代码
let router = await Dynamsoft.CVR.CaptureVisionRouter.createInstance();
let response = await fetch("./template.json");
let settings = await response.text();
await router.initSettings(settings);
let results = await router.capture(document.getElementById("image"),"ScanDocumentAndReadBarcode");

我们可以使用JSON DSL做更多的事情,例如设置图像处理参数,指定要使用的条形码格式等。可以在文档中了解相关信息。

PS:Dynamsoft Capture Vision需要Dynamsoft Document Normalizer v2+和Dynamsoft Barcode Reader v10+。

优点和缺点

在Dynamsoft Capture Vision中使用基于JSON的DSL有一些优点和缺点:

优点:

  • 数据捕获逻辑可以在不同平台之间共享,无需编写特定于平台的代码。
  • 图像处理结果可以在内部共享,以提高性能。例如,我们不需要重复将图像读取为字节或将图像转换为灰度的操作。
  • 领域专家可以比使用通用编程语言更有效地解决特定任务。

缺点:

  • 有一个学习曲线。
  • 设计和维护DSL是一项额外成本。
  • 使用宿主语言修改设置并不容易。这在交互式场景中通常是必要的,例如在裁剪之前修改扫描文档的边界。

为了克服这些缺点, Dynamsoft Capture Vision做了以下工作:

  1. 用于修改设置的编程接口: SimplifiedCaptureVisionSettings
  2. 帮助您学习的详细文档

源代码

可以在以下仓库中找到Dynamsoft Capture Vision的demo代码:github.com/tony-xlh/dy...

相关推荐
邂逅星河浪漫6 分钟前
【银行内网开发-管理端】Vue管理端+Auth后台开发+Nginx配置+Linux部署(详细解析)
linux·javascript·css·vue.js·nginx·html·前后端联调
星空椰12 分钟前
JavaScript 进阶基础:函数、作用域与常用技巧总结
开发语言·前端·javascript
奔跑的呱呱牛12 分钟前
@giszhc/vue-page-motion:Vue3 路由动画怎么做才“丝滑”?(附在线示例)
前端·javascript·vue.js
2501_9481142413 分钟前
2026模型能力分化加剧:多模型聚合架构的技术解析与工程落地思考
人工智能·ai·chatgpt·架构
gCode Teacher 格码致知2 小时前
Javascript提高:小数精度和随机数-由Deepseek产生
开发语言·javascript·ecmascript
实在智能RPA2 小时前
Agent 如何处理流程中的异常情况?2026年AI Agent架构工程与自愈机制深度拆解
人工智能·ai·架构
冴羽4 小时前
请愿书:Node.js 核心代码不应该包含 AI 代码!
前端·javascript·node.js
mmmmm123424 小时前
深入 DOM 查询底层:HTMLCollection 动态原理与 querySelectorAll 静态快照解析
前端·javascript
淸湫4 小时前
前端JavaScript:数据类型、实例对象 、内置对象、构造函数之间的关系
javascript
码路高手4 小时前
Trae-Agent中的 selector核心逻辑
人工智能·架构