Azure Document Intelligence

Azure Document Intelligence(以前称为 Form Recognizer)是一项云服务,可用于从文档中提取文本、键值对、表等信息。下面是一个使用 Python SDK 进行文档转换和提取信息的基本示例。

1. 安装依赖

首先,你需要安装 azure-ai-formrecognizer 库,可以使用以下命令进行安装:
登录后复制

plain 复制代码
pip install azure-ai-formrecognizer
2. 示例代码

下面的代码展示了如何使用 Document Intelligence 来分析一个文档(例如 PDF 或图像)并提取信息。

3. 代码说明
  • 导入必要的库 :导入 azure.ai.formrecognizer 库中的 DocumentAnalysisClientAzureKeyCredential
  • 创建客户端 :使用你的 Azure Document Intelligence 端点和密钥创建 DocumentAnalysisClient 实例。
  • 开始分析 :使用 begin_analyze_document_from_url 方法开始分析文档。这里使用了预构建的 prebuilt-document 模型,它可以识别文档中的文本、键值对和表格。
  • 处理结果:打印提取的文本、键值对和表格。
  • 异常处理:捕获并处理可能出现的异常。
4. 环境变量设置

你需要设置两个环境变量:

  • AZURE_FORM_RECOGNIZER_ENDPOINT:你的 Azure Document Intelligence 端点。
  • AZURE_FORM_RECOGNIZER_KEY:你的 Azure Document Intelligence 密钥。

可以使用以下命令在 Linux 或 macOS 上设置环境变量:
登录后复制

plain 复制代码
export AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
export AZURE_FORM_RECOGNIZER_KEY="your-key"

在 Windows 上,可以使用以下命令:
登录后复制

plain 复制代码
$env:AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
$env:AZURE_FORM_RECOGNIZER_KEY="your-key"

请确保将 "your-endpoint""your-key" 替换为你自己的实际值。

相关推荐
JohnYan3 分钟前
工作笔记 - 一种业务信息汇报机制的设计和实现
数据库·后端·postgresql
EdenX9 分钟前
MySQL详解:从基础到应用,附电商订单系统实战
后端
error_cn11 分钟前
匿名ftp服务器搭建指南
后端
马哥python说12 分钟前
【效率软件】抖音转换工具:主页链接和抖音号一键批量互转
爬虫·python
就是帅我不改14 分钟前
深入实战责任链模式:在企业级审批流程中的优雅应用
后端·面试
武子康14 分钟前
大数据-54 Kafka 安装配置 从 ZooKeeper 到 KRaft 的演进之路
大数据·后端·kafka
星辰大海的精灵15 分钟前
深入解析 CopyOnWriteArrayList
java·后端·算法
云边散步17 分钟前
《校园生活平台从 0 到 1 的搭建》第三篇:后端的微信授权登录
前端·后端
江山如画,佳人北望17 分钟前
pytorch常用函数
人工智能·pytorch·python
DM今天肝到几点?26 分钟前
【7.26-7.28胜算云AI日报:首个开源3D世界生成模型腾讯混元、微软预示 8 月 GPT-5 发布、Nemotron推理、商汤悟能、DM夺金】
人工智能·vscode·microsoft·3d·ai·chatgpt