Azure Document Intelligence

Azure Document Intelligence(以前称为 Form Recognizer)是一项云服务,可用于从文档中提取文本、键值对、表等信息。下面是一个使用 Python SDK 进行文档转换和提取信息的基本示例。

1. 安装依赖

首先,你需要安装 azure-ai-formrecognizer 库,可以使用以下命令进行安装:
登录后复制

plain 复制代码
pip install azure-ai-formrecognizer
2. 示例代码

下面的代码展示了如何使用 Document Intelligence 来分析一个文档(例如 PDF 或图像)并提取信息。

3. 代码说明
  • 导入必要的库 :导入 azure.ai.formrecognizer 库中的 DocumentAnalysisClientAzureKeyCredential
  • 创建客户端 :使用你的 Azure Document Intelligence 端点和密钥创建 DocumentAnalysisClient 实例。
  • 开始分析 :使用 begin_analyze_document_from_url 方法开始分析文档。这里使用了预构建的 prebuilt-document 模型,它可以识别文档中的文本、键值对和表格。
  • 处理结果:打印提取的文本、键值对和表格。
  • 异常处理:捕获并处理可能出现的异常。
4. 环境变量设置

你需要设置两个环境变量:

  • AZURE_FORM_RECOGNIZER_ENDPOINT:你的 Azure Document Intelligence 端点。
  • AZURE_FORM_RECOGNIZER_KEY:你的 Azure Document Intelligence 密钥。

可以使用以下命令在 Linux 或 macOS 上设置环境变量:
登录后复制

plain 复制代码
export AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
export AZURE_FORM_RECOGNIZER_KEY="your-key"

在 Windows 上,可以使用以下命令:
登录后复制

plain 复制代码
$env:AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
$env:AZURE_FORM_RECOGNIZER_KEY="your-key"

请确保将 "your-endpoint""your-key" 替换为你自己的实际值。

相关推荐
Tipriest_2 分钟前
Python关键字梳理
python·关键字·keyword
M1A121 分钟前
TCP/IP协议精解:IP协议——互联网世界的邮政编码系统
后端·网络协议·tcp/ip
逸风尊者28 分钟前
开发易掌握的知识:GeoHash查找附近空闲车辆
java·后端
im_AMBER1 小时前
学习日志05 python
python·学习
大虫小呓1 小时前
Python 处理 Excel 数据 pandas 和 openpyxl 哪家强?
python·pandas
哪 吒2 小时前
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)
python·算法·华为od·华为od机试·2025b卷
程序猿阿越2 小时前
Kafka源码(一)Controller选举与创建Topic
java·后端·源码
程序员爱钓鱼2 小时前
Go语言项目工程化 — 常见开发工具与 CI/CD 支持
开发语言·后端·golang·gin
Jiude2 小时前
MinIO 社区版被故意阉割,Web管理功能全面移除。我来试试国产RustFS
后端·docker·架构
仰望星空@脚踏实地2 小时前
Spring Boot Web 服务单元测试设计指南
spring boot·后端·单元测试