百度OCR图片文字识别

前言

最近客户提了一个需求,他们的出货单,每天需要填报大量的车辆数据和驾驶员信息,每次手动录入太费事了。能不能做一个功能,拍张照片直接上传到系统,自动识别数据录入。现在市场上有很多的OCR可以使用,我们来体验下百度OCR如何使用的。我们需要进入百度智能云,注册并实名认证,接下来我们来体验下里面的文字识别api如何使用。

通用文字识别

创建应用

进入公有云服务,在应用列表中创建个人新应用,选择自己需要用到的服务

拿到API Key和Secret Key

获取access_token

百度AI开放平台使用OAuth2.0授权调用开放API,调用API时必须在URL中带上Access_token参数,Access token默认有效期为30天。向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求。

  • grant_type :固定为client_credential
  • client_id :的API Key
  • client_secret :的Secret Key
js 复制代码
const res = await axios.post('/baidu_oca/oauth/2.0/token?client_id=XXX&client_secret=XXX&grant_type=client_credentials')
const { access_token } = res.data
console.log(access_token)

识别图片文字

图片如下图所示(该为测试样例),图片文字识别按照行和表格列解析。

将图片转为base64并发起请求

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic

js 复制代码
const base64 = '图片base64'
const imageBase64 = base64.replace(/^data:image\/\w+;base64,/, '')
const formData = new FormData()
formData.append('image', imageBase64)
const data = await axios.post(
  '/baidu_oca/rest/2.0/ocr/v1/accurate_basic?access_token=' + access_token,
  formData,
  {
    "Content-Type": 'application/x-www-form-urlencoded'
  }
)

中间两部分就是我们需要录入的数据,截取前后固定数据,中间循环入库即可。

银行卡识别

接口描述

支持对主流银行卡的卡号、有效期、发卡行、卡片类型、持卡人、银行卡号位置 6 个关键字段进行结构化识别,识别准确率超过99%。同时支持返回银行卡号的字段位置坐标,及开启银行卡质量类型检测。

发送请求

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/doc_analysis_office。 请求方式同通用文字识别,返回结构如下:

身份证识别

接口描述

支持对二代居民身份证正反面所有8个字段进行结构化识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率超过99%;同时支持身份证正面头像检测,并返回头像切片的base64编码信息(入参添加detect_card:true即可)。

发送请求

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/idcard。 请求方式同通用文字识别,返回结构如下:

结语

总体上来说,百度OCR使用还是非常简单便捷的。个人用户单个api有1000次的免费调用额度,可以供平时调试使用。如果想了解更多api可以移步官网查看。

相关推荐
NiceCloud喜云3 小时前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
wordbaby3 小时前
React Native + RNOH:跨页面数据回传的最佳实践与避坑指南
前端·react native
丷丩3 小时前
MapLibre GL JS第22课:查看本地GeoJSON
前端·javascript·map·mapbox·maplibre gl js
Front思4 小时前
AI前端工程师需要具备能力+
前端·人工智能·ai
ZC跨境爬虫6 小时前
跟着 MDN 学CSS day_29:(掌握文本与字体样式的核心艺术)
前端·css·ui·html·tensorflow
李子琪。7 小时前
网络空间安全深度实战:CSRF 漏洞原理剖析与基于 Token 的纵深防御体系构建(全栈实验报告)
前端·安全·csrf
冰暮流星7 小时前
javascript之history对象介绍
前端·笔记
IT_陈寒8 小时前
Vite热更新失灵?你可能漏了这个配置
前端·人工智能·后端
丷丩8 小时前
MapLibre GL JS第19课:实时更新要素
前端·javascript·gis·map·mapbox·maplibre gl js
Mr.Daozhi8 小时前
RAG 进阶实战:跑通 Demo 后我连续翻了 6 次车,逐一修复才真正可用(含 Gradio Web 版)
前端·数据库·langchain·大模型·gradio·rag·科研工具