【Azure 架构师学习笔记 】- Azure AI(7)-Azure认知服务-Document Intelligence进阶使用

本文属于【Azure 架构师学习笔记】系列

本文属于【Azure AI】系列

接上文 【Azure 架构师学习笔记 】- Azure AI(6)-Azure认知服务-Document Intelligence简单使用

前言

前面演示了Document Intelligence的简单入门,接下来做一些进阶的使用,比如训练模型。首先我们从document intelligence 进去studio, 但是现在已经跟content understanding进行了整合。所以看到的是下面的样子:

配置环境

这里可以看到需要选择一个AI Foundry resource, 如果跟我一样也没有,那么可以跳转到【Azure 架构师学习笔记 】- Azure AI(8)-Azure AI Foundry 先搭建和学习。

在创建好Azure AI Foundry之后,回到这里可以接续创建新项目:

选择数据源,可以看出这里的数据源只支持blob storage account:

配置好数据源之后,需要上传一些训练集,这里随便在网上找了一些例子然后通过修改号码,日期等方式生成了5分PDF 文件并上传。比如下面的Company Phone。

上传文件:

上传文件后点击【run analysis】进行分析,可以看到分析后右边schema会出现一些内容,通过按需调整来训练出符合自己需求的模型:

保存变更:

分别对每个文件都进行分析:

当分析完毕之后,选择【build analyzer】来创建模型:

对模型命名:

然后用上一文的发票文件进行测试,可以看到是不通过的。

然后再上传一个本文使用的测试用例,分析成功。

后续可以使用API 的方式去调用这个analyzer来对文档分析或者按需继续训练。

小结

本文通过 Azure AI Content Understanding 服务,训练一个能够从特定格式的文档(如采购订单)中自动提取关键字段的自定义模型,验证从无到有构建专属文档智能解决方案的完整流程。但是由于还有很多AI 内容值得探索,所以这里就不做深入介绍,等有需要的时候再继续深入。

相关推荐
Gale2World几秒前
OpenClaw 技术专题 (一):核心哲学与宏观架构 (The Foundation)
人工智能·agent
香草泡芙几秒前
解锁AI Agent潜能:基于Langchain组件库的落地指南(2)
前端·javascript·人工智能
chaors1 分钟前
从零学RAG0x0a:AdvancedRAG查询优化-问题丰富 & 问题拆解
人工智能·langchain·ai编程
小凡同志2 分钟前
CLAUDE.md 完全指南:把Claude Code调教成你的专属编程搭档
人工智能·claude
Lim小刘3 分钟前
告别“裸奔”:OpenClaw 龙虾 Agent 在 AWS 上的企业级安全加固实战
人工智能·安全·aws·openclaw
chaors5 分钟前
从零学RAG0x09:AdvancedRAG假设性文档 & 元数据索引优化
人工智能·langchain·ai编程
电商API&Tina6 分钟前
淘宝商品视频的采集需要注意哪些问题||item_video-获得淘宝商品视频
大数据·网络·数据库·人工智能·python·音视频
忧郁的橙子.6 分钟前
04-自定义微调训练BERT模型效果测试 +中文八分类
人工智能·深度学习·bert·中文多分类模型训练
Honeyeagle9 分钟前
复合式气体检测仪厂家:技术筑基,服务破局
大数据·人工智能
LSQ的测试日记12 分钟前
深度学习_目标检测,RCNN,Fast-RCNN和Faster-RCNN
人工智能·深度学习·目标检测