【Azure 架构师学习笔记 】- Azure AI(7)-Azure认知服务-Document Intelligence进阶使用

本文属于【Azure 架构师学习笔记】系列

本文属于【Azure AI】系列

接上文 【Azure 架构师学习笔记 】- Azure AI(6)-Azure认知服务-Document Intelligence简单使用

前言

前面演示了Document Intelligence的简单入门,接下来做一些进阶的使用,比如训练模型。首先我们从document intelligence 进去studio, 但是现在已经跟content understanding进行了整合。所以看到的是下面的样子:

配置环境

这里可以看到需要选择一个AI Foundry resource, 如果跟我一样也没有,那么可以跳转到【Azure 架构师学习笔记 】- Azure AI(8)-Azure AI Foundry 先搭建和学习。

在创建好Azure AI Foundry之后,回到这里可以接续创建新项目:

选择数据源,可以看出这里的数据源只支持blob storage account:

配置好数据源之后,需要上传一些训练集,这里随便在网上找了一些例子然后通过修改号码,日期等方式生成了5分PDF 文件并上传。比如下面的Company Phone。

上传文件:

上传文件后点击【run analysis】进行分析,可以看到分析后右边schema会出现一些内容,通过按需调整来训练出符合自己需求的模型:

保存变更:

分别对每个文件都进行分析:

当分析完毕之后,选择【build analyzer】来创建模型:

对模型命名:

然后用上一文的发票文件进行测试,可以看到是不通过的。

然后再上传一个本文使用的测试用例,分析成功。

后续可以使用API 的方式去调用这个analyzer来对文档分析或者按需继续训练。

小结

本文通过 Azure AI Content Understanding 服务,训练一个能够从特定格式的文档(如采购订单)中自动提取关键字段的自定义模型,验证从无到有构建专属文档智能解决方案的完整流程。但是由于还有很多AI 内容值得探索,所以这里就不做深入介绍,等有需要的时候再继续深入。

相关推荐
带刺的坐椅1 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
冬奇Lab3 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab3 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩5 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒5 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海5 小时前
AI额度不够用的解决方案
人工智能
lincats6 小时前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
后端小肥肠6 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao6 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理