本文属于【Azure 架构师学习笔记】系列。
本文属于【Azure AI】系列。
接上文 【Azure 架构师学习笔记 】- Azure AI(6)-Azure认知服务-Document Intelligence简单使用
前言
前面演示了Document Intelligence的简单入门,接下来做一些进阶的使用,比如训练模型。首先我们从document intelligence 进去studio, 但是现在已经跟content understanding进行了整合。所以看到的是下面的样子:

配置环境
这里可以看到需要选择一个AI Foundry resource, 如果跟我一样也没有,那么可以跳转到【Azure 架构师学习笔记 】- Azure AI(8)-Azure AI Foundry 先搭建和学习。

在创建好Azure AI Foundry之后,回到这里可以接续创建新项目:

选择数据源,可以看出这里的数据源只支持blob storage account:

配置好数据源之后,需要上传一些训练集,这里随便在网上找了一些例子然后通过修改号码,日期等方式生成了5分PDF 文件并上传。比如下面的Company Phone。

上传文件:

上传文件后点击【run analysis】进行分析,可以看到分析后右边schema会出现一些内容,通过按需调整来训练出符合自己需求的模型:

保存变更:

分别对每个文件都进行分析:

当分析完毕之后,选择【build analyzer】来创建模型:

对模型命名:

然后用上一文的发票文件进行测试,可以看到是不通过的。

然后再上传一个本文使用的测试用例,分析成功。

后续可以使用API 的方式去调用这个analyzer来对文档分析或者按需继续训练。
小结
本文通过 Azure AI Content Understanding 服务,训练一个能够从特定格式的文档(如采购订单)中自动提取关键字段的自定义模型,验证从无到有构建专属文档智能解决方案的完整流程。但是由于还有很多AI 内容值得探索,所以这里就不做深入介绍,等有需要的时候再继续深入。