EasyclickOCR模块的正确用法

EasyclickOCR模块的正确用法

一、核心函数(官方明确支持)

函数 版本要求 说明 参数示例
ocr.newOcr() EC 9.17.0+ 实例化OCR对象 (9.17+版本必须用它初始化,而非全局ocr let o = ocr.newOcr();(文档示例)
o.initOcr(config) EC 9.17.0+ 初始化OCR引擎(需传入引擎类型及参数) o.initOcr({"type": "paddleOcrOnnxV4", "modelsDir": "", "numThread": 2})
o.ocrImage(img) EC 8.2.0+ 识别Image对象 (输入为image类型,来自截图/裁剪) o.ocrImage(targetImg, 20000, {})
o.ocrBitmap(bitmap) EC 5.17.0+ 识别Bitmap对象 (输入为bitmap类型,底层Android Bitmap) o.ocrBitmap(bitmap, 20000, {"token": "xxx"})
o.releaseAll() EC 5.17.0+ 释放OCR实例资源 o.releaseAll()(文档示例)
o.getErrorMsg() EC 5.17.0+ 获取错误信息 loge("错误:" + o.getErrorMsg())

二、关键文档细节

  1. 9.17+版本必须用ocr.newOcr()初始化
    文档原文:"ocr.newOcr 实例一个ocr 初始化一个ocr实例 适配版本 EC安卓 9.17.0+",并给出示例:
javascript 复制代码
   function main() {
     let o = ocr.newOcr(); // 实例化OCR对象(9.17+必须)
     // 这里做初始化和识别
     o.releaseAll() // 释放资源
   }
  1. 支持Image和Bitmap双输入
    • Image输入 :用o.ocrImage(img, timeout, extra),参数为image对象(来自images.captureScreen()images.read()等)。
    • Bitmap输入 :用o.ocrBitmap(bitmap, timeout, extra),参数为bitmap对象(Android原生Bitmap,可通过images.getBitmap(img)转换)。
      文档原文:"识别有两种图像方式 image 和bitmap""ocr.ocrBitmap 识别文字 对Bitmap进行OCR",并返回包含label(文字)、confidence(准确度)、x/y/width/height(坐标)的JSON。

三、正确代码示例

1. 9.17+版本:用ocr.newOcr()初始化+PaddleOCR ONNX V4识别
javascript 复制代码
// 脚本停止回调(释放资源)
setStopCallback(function () {
  logi("释放OCR实例")
  if (paddleOcrOnnx) {
    paddleOcrOnnx.releaseAll() // 释放实例资源
    paddleOcrOnnx = null
  }
})

// 初始化环境(申请截图权限)
function initEnv() {
  if (!startEnv()) exit()
  if (!image.requestScreenCapture(10000, 0)) {
    loge("截图权限失败")
    exit()
  }
  sleep(1000) // 等待权限生效
}

// 初始化PaddleOCR ONNX V4(用newOcr实例化)
function initPaddleOcr() {
  // 1. 实例化OCR对象(9.17+必须)
  let paddleOcrOnnx = ocr.newOcr()
  // 2. 配置引擎参数(文档示例)
  let paddleOnnxMap = {
    "type": "paddleOcrOnnxV4", // 引擎类型(文档支持)
    "modelsDir": "", // 模型目录(可选)
    "numThread": 2, // 线程数
    "padding": 60, // 白边
    "maxSideLen": 960 // 最大边长
  }
  // 3. 初始化引擎
  if (!paddleOcrOnnx.initOcr(paddleOnnxMap)) {
    loge("OCR初始化失败:" + paddleOcrOnnx.getErrorMsg())
    exit()
  }
  return paddleOcrOnnx
}

// OCR识别(用Image输入)
function ocrWithImage(ocrInstance) {
  // 截图(生成Image对象)
  let img = image.captureFullScreenEx() // 文档支持的截图函数
  if (!img) {
    loge("截图失败")
    return
  }
  // 识别Image对象(文档函数:ocrImage)
  let result = ocrInstance.ocrImage(img, 20 * 1000, {}) // 超时20秒
  if (result) {
    logd("OCR结果(Image输入):" + JSON.stringify(result))
    // 解析结果(文档格式:label/confidence/x/y/width/height)
    for (let i = 0; i < result.length; i++) {
      let item = result[i]
      logd(`文字:${item.label} 准确度:${item.confidence} 位置:${item.x},${item.y},${item.width},${item.height}`)
    }
  }
  image.recycle(img) // 回收Image资源
}

// OCR识别(用Bitmap输入)
function ocrWithBitmap(ocrInstance) {
  // 截图并转换为Bitmap(文档支持)
  let img = image.captureFullScreenEx()
  let bitmap = images.getBitmap(img) // 转换为Bitmap对象
  image.recycle(img) // 回收Image资源
  
  // 识别Bitmap对象(文档函数:ocrBitmap)
  let result = ocrInstance.ocrBitmap(bitmap, 20 * 1000, {"token": "xxx"})
  if (result) {
    logd("OCR结果(Bitmap输入):" + JSON.stringify(result))
  }
  images.recycleBitmap(bitmap) // 回收Bitmap资源
}

// 主函数
function main() {
  initEnv()
  // 1. 用newOcr实例化(9.17+必须)
  let paddleOcrOnnx = initPaddleOcr()
  // 2. 分别用Image和Bitmap输入识别
  ocrWithImage(paddleOcrOnnx)
  ocrWithBitmap(paddleOcrOnnx)
  // 3. 释放资源(setStopCallback也会处理)
  paddleOcrOnnx.releaseAll()
}

main()

四、总结

  1. 9.17+版本 :必须用ocr.newOcr()实例化OCR对象,再用o.initOcr()初始化引擎。
  2. 输入支持 :同时支持image(高层封装)和bitmap(底层Android Bitmap)两种输入,分别对应o.ocrImage()o.ocrBitmap()
  3. 资源管理 :每个实例需用o.releaseAll()释放,脚本停止时用setStopCallback兜底。
相关推荐
我有2只猫13 小时前
LabelStudio二次开发
人工智能·python·django·ocr
余俊晖19 小时前
多模态文档解析后处理开源模型:MinerU-Popo方案思路提升RAG性能
人工智能·ocr·多模态
超人也会哭️呀19 小时前
视觉模型中的坐标漂移
人工智能·ai·llm·ocr·vlm·视觉模型·dots.ocr
开开心心就好2 天前
无弹窗不更新的PC本地播放工具
运维·科技·macos·docker·计算机外设·ocr·powerpoint
MageGojo2 天前
OCR 火车票识别 API 服务介绍与使用考量
ocr·接口·api·数据提取·火车票识别
星光一影2 天前
一个开源 OCR 引擎,支持 100+ 语言,能识别表格、公式、印章,而且完全免费
开源·ocr
开开心心就好2 天前
支持多显示器的Windows高效分屏工具
运维·python·科技·游戏·计算机外设·ocr·powerpoint
YXWik62 天前
图片 OCR 文字提取 (Python + AI 模型(ModelScope))
人工智能·python·ocr
AI人工智能+3 天前
一种基于深度学习的端到端户口本识别技术,通过多阶段神经网络架构实现高精度信息提取
人工智能·深度学习·计算机视觉·自然语言处理·ocr
Mr -老鬼3 天前
EasyClick iOS自动化7.1.0新版本详解
ios·自动化·easyclick