Azure Document Intelligence

Azure Document Intelligence(以前称为 Form Recognizer)是一项云服务,可用于从文档中提取文本、键值对、表等信息。下面是一个使用 Python SDK 进行文档转换和提取信息的基本示例。

1. 安装依赖

首先,你需要安装 azure-ai-formrecognizer 库,可以使用以下命令进行安装:
登录后复制

plain 复制代码
pip install azure-ai-formrecognizer
2. 示例代码

下面的代码展示了如何使用 Document Intelligence 来分析一个文档(例如 PDF 或图像)并提取信息。

3. 代码说明
  • 导入必要的库 :导入 azure.ai.formrecognizer 库中的 DocumentAnalysisClientAzureKeyCredential
  • 创建客户端 :使用你的 Azure Document Intelligence 端点和密钥创建 DocumentAnalysisClient 实例。
  • 开始分析 :使用 begin_analyze_document_from_url 方法开始分析文档。这里使用了预构建的 prebuilt-document 模型,它可以识别文档中的文本、键值对和表格。
  • 处理结果:打印提取的文本、键值对和表格。
  • 异常处理:捕获并处理可能出现的异常。
4. 环境变量设置

你需要设置两个环境变量:

  • AZURE_FORM_RECOGNIZER_ENDPOINT:你的 Azure Document Intelligence 端点。
  • AZURE_FORM_RECOGNIZER_KEY:你的 Azure Document Intelligence 密钥。

可以使用以下命令在 Linux 或 macOS 上设置环境变量:
登录后复制

plain 复制代码
export AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
export AZURE_FORM_RECOGNIZER_KEY="your-key"

在 Windows 上,可以使用以下命令:
登录后复制

plain 复制代码
$env:AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
$env:AZURE_FORM_RECOGNIZER_KEY="your-key"

请确保将 "your-endpoint""your-key" 替换为你自己的实际值。

相关推荐
程序员清风3 分钟前
网易三面:Java中默认使用的垃圾回收器及特点分版本说说?
java·后端·面试
hui函数5 分钟前
Python全栈(基础篇)——Day07:后端内容(函数的参数+递归函数+实战演示+每日一题)
后端·python
爱吃烤鸡翅的酸菜鱼11 分钟前
深度掌握 Git 分支体系:从基础操作到高级策略与实践案例
分布式·git·后端·gitee·github
IT_陈寒13 分钟前
Python性能优化:5个让你的代码提速300%的NumPy高级技巧
前端·人工智能·后端
风象南16 分钟前
从RBAC到ABAC的进阶之路:基于jCasbin实现无侵入的SpringBoot权限校验
spring boot·后端
小蒜学长21 分钟前
jsp基于JavaWeb的原色蛋糕商城的设计与实现(代码+数据库+LW)
java·开发语言·数据库·spring boot·后端
MYX_30924 分钟前
第二章 预备知识(线性代数)
python·线性代数·机器学习
zhangfeng113326 分钟前
亲测可用,R语言 ggplot2 箱线图线条控制参数详解,箱线图离散数值控制
开发语言·python·r语言·生物信息
yzx99101326 分钟前
国庆科技感祝福:Python 粒子国旗动画
开发语言·人工智能·python
JaguarJack26 分钟前
PHP 图像处理实战 GD/Imagick 从入门到精通,构建高性能图像服务
后端·php