Azure Document Intelligence

Azure Document Intelligence(以前称为 Form Recognizer)是一项云服务,可用于从文档中提取文本、键值对、表等信息。下面是一个使用 Python SDK 进行文档转换和提取信息的基本示例。

1. 安装依赖

首先,你需要安装 azure-ai-formrecognizer 库,可以使用以下命令进行安装:
登录后复制

plain 复制代码
pip install azure-ai-formrecognizer
2. 示例代码

下面的代码展示了如何使用 Document Intelligence 来分析一个文档(例如 PDF 或图像)并提取信息。

3. 代码说明
  • 导入必要的库 :导入 azure.ai.formrecognizer 库中的 DocumentAnalysisClientAzureKeyCredential
  • 创建客户端 :使用你的 Azure Document Intelligence 端点和密钥创建 DocumentAnalysisClient 实例。
  • 开始分析 :使用 begin_analyze_document_from_url 方法开始分析文档。这里使用了预构建的 prebuilt-document 模型,它可以识别文档中的文本、键值对和表格。
  • 处理结果:打印提取的文本、键值对和表格。
  • 异常处理:捕获并处理可能出现的异常。
4. 环境变量设置

你需要设置两个环境变量:

  • AZURE_FORM_RECOGNIZER_ENDPOINT:你的 Azure Document Intelligence 端点。
  • AZURE_FORM_RECOGNIZER_KEY:你的 Azure Document Intelligence 密钥。

可以使用以下命令在 Linux 或 macOS 上设置环境变量:
登录后复制

plain 复制代码
export AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
export AZURE_FORM_RECOGNIZER_KEY="your-key"

在 Windows 上,可以使用以下命令:
登录后复制

plain 复制代码
$env:AZURE_FORM_RECOGNIZER_ENDPOINT="your-endpoint"
$env:AZURE_FORM_RECOGNIZER_KEY="your-key"

请确保将 "your-endpoint""your-key" 替换为你自己的实际值。

相关推荐
却尘几秒前
一篇小白也能看懂的 Go 字符串拼接 & Builder & cap 全家桶
后端·go
茶杯梦轩1 分钟前
从零起步学习Redis || 第七章:Redis持久化方案的实现及底层原理解析(RDB快照与AOF日志)
redis·后端
QZQ541881 分钟前
重构即时IM项目13:优化消息通路(下)
后端
柠檬味拥抱1 分钟前
揭秘Cookie操纵:深入解析模拟登录与维持会话技巧
后端
不想打工的码农3 分钟前
MyBatis-Plus多数据源实战:被DBA追着改配置后,我肝出这份避坑指南(附动态切换源码)
java·后端
Pyeako6 分钟前
深度学习--卷积神经网络(下)
人工智能·python·深度学习·卷积神经网络·数据增强·保存最优模型·数据预处理dataset
ZeroTaboo6 分钟前
rmx:给 Windows 换一个能用的删除
前端·后端
OPEN-Source8 分钟前
大模型实战:搭建一张“看得懂”的大模型应用可观测看板
人工智能·python·langchain·rag·deepseek
廖圣平9 分钟前
从零开始,福袋直播间脚本研究【七】《添加分组和比特浏览器》
python
B站_计算机毕业设计之家9 分钟前
豆瓣电影数据可视化分析系统 | Python Flask框架 requests Echarts 大数据 人工智能 毕业设计源码(建议收藏)✅
大数据·python·机器学习·数据挖掘·flask·毕业设计·echarts