Python:百度AI开放平台——OCR图像文字识别应用

一、注册百度AI开放平台

使用百度AI服务的步骤为:

  1. 注册:注册成为百度AI开放平台开发者;
  2. 创建AI应用:在百度API开放平台上创建相关类型的的AI应用,获得AppID、API Key和Secret Key;
  3. 调用API:调用相关类型的API,获得AI功能的结果,为开发者的应用服务。

注册的操作步骤:

  1. 登录百度AI开放平台,百度AI开放平台-全球领先的人工智能服务平台,进入百度大脑│AI开放平台首页,如图所示。鼠标点击页面右上角"控制台",进入登录页面。如果已有百度账号,可以使用账号直接登录;如果没有账号,请点击立即注册,按系统要求输入新用户信息,完成系统注册。
  2. 使用用户名、密码登录平台,并需要进行系统认证,认证通过就成为百度AI开放平台开发者,可以使用系统服务。

二、创建OCR文字识别应用

1、登录 进去之后,点击"控制台",再点击左上角的"三",如下图

选择人工智能中的"文字识别"

2、领取免费资源:点击下图所示的"去领取 ",选择"通用场景OCR",接口名称勾选"全部",然后点击左下角的"0元领取"按钮即可完成领取免费资源。

3、点击创建应用下的"去创建 "链接,进入页面,必须填写上应用名称以及应用描述,然后单击左下角的"立即创建"。创建成功后点击"应用列表",即可在应用列表页面看到AppID、API Key、Secret Key的信息,将上述3项百度授权信息复制记录下来,创建"文字识别"的Python应用程序需使用。

三、OCR应用程序实现

1、安装baidu-aip模块 :在windows的命令提示符输入pip install baidu-aip,安装百度智能第三方库模块,安装完成后Python的环境配置就设置好了

2、调用应用对图形文件进行识别

python 复制代码
from aip import AipOcr #调用百度智能模块中文字识别类方法
#填写个人的 baiinu-ocr aip
APP_ID = '------------------------'

API_KEY = '------------------------------------------------------------------'

SECRET_KEY = '------------------------------------------------------------------------'


client = AipOcr(APP_ID,API_KEY,SECRET_KEY)
fp = open(r'------------------------------.png','rb') #打开所需文字识别的文件
img = fp.read()
message = client.general(img) #调用general方法返回的信息是字典类型的,结果保存在键'words_result'的值中

for i in message['words_result']:
    print(i['words'])

fp.close()

注意:我是在windows Python 的IDLE环境下运行的

相关推荐
超龄超能程序猿32 分钟前
(三)PS识别:基于噪声分析PS识别的技术实现
图像处理·人工智能·计算机视觉
要努力啊啊啊34 分钟前
YOLOv3-SPP Auto-Anchor 聚类调试指南!
人工智能·深度学习·yolo·目标检测·目标跟踪·数据挖掘
好开心啊没烦恼37 分钟前
Python 数据分析:numpy,说人话,说说数组维度。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy
生态遥感监测笔记43 分钟前
GEE利用已有土地利用数据选取样本点并进行分类
人工智能·算法·机器学习·分类·数据挖掘
天天扭码1 小时前
从图片到语音:我是如何用两大模型API打造沉浸式英语学习工具的
前端·人工智能·github
张彦峰ZYF2 小时前
从检索到生成:RAG 如何重构大模型的知识边界?
人工智能·ai·aigc
刘海东刘海东2 小时前
结构型智能科技的关键可行性——信息型智能向结构型智能的转变(修改提纲)
人工智能·算法·机器学习
**梯度已爆炸**2 小时前
NLP文本预处理
人工智能·深度学习·nlp
uncle_ll2 小时前
李宏毅NLP-8-语音模型
人工智能·自然语言处理·语音识别·语音模型·lm
Liudef062 小时前
FLUX.1-Kontext 高效训练 LoRA:释放大语言模型定制化潜能的完整指南
人工智能·语言模型·自然语言处理·ai作画·aigc