Azure Document Intelligence

Azure Document Intelligence(以前称为 Form Recognizer)是一项云服务,可用于从文档中提取文本、键值对、表等信息。下面是一个使用 Python SDK 进行文档转换和提取信息的基本示例。

1. 安装依赖

首先,你需要安装 azure-ai-formrecognizer 库,可以使用以下命令进行安装:
登录后复制

plain 复制代码
pip install azure-ai-formrecognizer
2. 示例代码

下面的代码展示了如何使用 Document Intelligence 来分析一个文档(例如 PDF 或图像)并提取信息。

3. 代码说明
  • 导入必要的库 :导入 azure.ai.formrecognizer 库中的 DocumentAnalysisClientAzureKeyCredential
  • 创建客户端 :使用你的 Azure Document Intelligence 端点和密钥创建 DocumentAnalysisClient 实例。
  • 开始分析 :使用 begin_analyze_document_from_url 方法开始分析文档。这里使用了预构建的 prebuilt-document 模型,它可以识别文档中的文本、键值对和表格。
  • 处理结果:打印提取的文本、键值对和表格。
  • 异常处理:捕获并处理可能出现的异常。
4. 环境变量设置

你需要设置两个环境变量:

  • AZURE_FORM_RECOGNIZER_ENDPOINT:你的 Azure Document Intelligence 端点。
  • AZURE_FORM_RECOGNIZER_KEY:你的 Azure Document Intelligence 密钥。

可以使用以下命令在 Linux 或 macOS 上设置环境变量:
登录后复制

plain 复制代码
export AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
export AZURE_FORM_RECOGNIZER_KEY="your-key"

在 Windows 上,可以使用以下命令:
登录后复制

plain 复制代码
$env:AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
$env:AZURE_FORM_RECOGNIZER_KEY="your-key"

请确保将 "your-endpoint""your-key" 替换为你自己的实际值。

相关推荐
uzong7 分钟前
9 种 RAG 架构,每位 AI 开发者必学:完整实战指南
后端
老前端的功夫15 分钟前
【Java从入门到入土】28:Stream API:告别for循环的新时代
java·开发语言·python
小江的记录本18 分钟前
【Kafka核心】架构模型:Producer、Broker、Consumer、Consumer Group、Topic、Partition、Replica
java·数据库·分布式·后端·搜索引擎·架构·kafka
止语Lab28 分钟前
从手动到框架:Go DI 演进的三个拐点
开发语言·后端·golang
蚰蜒螟34 分钟前
深入 Linux 内核同步机制:从 futex 到 spinlock 的完整旅程
linux·windows·microsoft
yaoxin52112342 分钟前
397. Java 文件操作基础 - 创建常规文件与临时文件
java·开发语言·python
dFObBIMmai1 小时前
MySQL主从同步中大事务导致的延迟_如何拆分大事务优化同步
jvm·数据库·python
szccyw01 小时前
mysql如何限制特定存储过程执行权限_MySQL存储过程安全访问
jvm·数据库·python
小白学大数据1 小时前
Python 自动化爬取网易云音乐歌手歌词实战教程
爬虫·python·okhttp·自动化
TO_ZRG1 小时前
Android Activity、Fragment、ViewModel 完全入门指南
microsoft