AWS re:Invent 2024 已圆满落幕!
在本次大会中,隆重推出了一项全新功能:
Amazon Bedrock Data Automation(预览版)震撼登场!
简单总结
- Amazon Bedrock Data Automation(简称 BDA)是一项全托管服务,能够从文档、图片、音频、视频等非结构化多模态内容中提取有价值的信息。
- 它支持视频关键时刻摘要、不良图像内容检测、复杂文档自动分析等功能,帮助高效处理多样化内容。
- BDA既可独立使用,也可作为解析器应用于RAG工作流中的知识库配置,灵活适配多种场景。
亮点
- 传统的 RAG 主要依赖文本内容进行信息提取,而 BDA 的推出突破了这一限制。
- 它能够轻松处理非结构化的多模态内容,提取更多维度的信息。
- 这为构建基于多样化上下文的 RAG 提供了更丰富的可能性,让应用场景更加广泛!
亚马逊云科技官方文档通
Amazon Bedrock Data Automation(BDA)的综合用户指南
在知识库中使用 BDA 进行数据解析的用户指南
Feature support by AWS Region in Amazon Bedrock - Amazon BedrockFor a list of AWS Regions that support Amazon Bedrock, see Amazon Bedrock endpoints and quotas . Amazon Bedrock features differ in their regional support.https://docs.aws.amazon.com/bedrock/latest/userguide/features-regions.html这是关于 Amazon Bedrock 功能可用区域的相关指南。虽然目前文档中还没有明确提到 BDA 的内容,但未来很有可能会更新包含这部分信息。目前通过管理控制台,我们已经确认 BDA 在俄勒冈区域可以使用。
动手尝试
打开 AWS 管理控制台,在俄勒冈区域的 Amazon Bedrock 服务页面中选择"Data Automation(数据自动化)"。
根据不同的使用场景,提供了两种输出类型,也可以将它们结合使用。
- 标准输出
- 自定义输出
来试试这个DEMO吧。
来执行流程如下:
- 选择/上传文件
- 查看结果
- 创建项目/蓝图
- 使用资源
让我们尝试通过以下设置生成结果:
- 选择示例演示或上传文件开始:使用示例演示
- 选择资产文件类型:文档
- 驾驶执照
作为结果的输出目标,需要创建一个 S3 存储桶。点击确认后,存储桶将自动创建,并开始生成结果。
生成的结果如上。
标准输出
让我们查看结果的标准输出选项卡。其中有一个名为"Configuration(配置)"的部分,显示了生成标准输出结果所使用的设置。例如,可以看到以下设置被使用:
- 文本格式:带有 Markdown 的文本
- 输出格式:JSON
向页面下方滚动,可以看到一个名为"Results(结果)"的部分,其中显示了生成的结果。在文档级别的选项卡中,根据驾驶执照的图像,以带有 Markdown 的文本格式生成了结果。
在"Element Level"选项卡中,基于文档的各个元素,结果以带有 Markdown 的文本格式生成。
点击"Results"中的"Download Results"按钮后,会下载一个名为 Results.zip 的文件。解压后可以看到一个名为 StandardOutputDocument.json 的文件。通过该文件,可以以之前在"Output Format"中选择的 JSON 格式查看生成的结果。
移动到页面右上角,可以返回到"Configuration(配置)"部分。点击 Regenerate results 按钮,可以重新生成结果。点击 Add to project 按钮,可以将配置添加到新的项目或现有项目中。
尝试创建并添加到新项目中。点击按钮后,会弹出一个对话框,在其中输入项目名称并完成创建。
新的项目已成功创建,Configuration 的内容已被添加到项目中。
Custom output
让我们来查看结果的"自定义输出"选项卡。这是一个通过 BDA 从文档或图像中提取信息时,用于细化输出设置的功能。借助该功能,可以将提取的数据转换为特定的格式或结构。
蓝图(Blueprint)在这里就像一份"指令清单",详细说明了如何从文件中提取信息以及如何转换输出。可以将蓝图比作一份"配方",而 BDA 则根据这份配方处理数据。
在本次操作中,使用的是名为 US-Driver-License 的示例蓝图。由于示例蓝图无法直接编辑,如果需要调整,可以复制蓝图后进行修改。
点击"复制蓝图"按钮后,会弹出如上图所示的对话框。输入蓝图名称后即可完成复制操作。
已跳转到自定义输出设置的目标蓝图页面。在这个页面上,可以通过图形界面(GUI)对刚刚复制的蓝图进行编辑。编辑完成后,可以将蓝图添加到项目中,或者选择保存蓝图以进行版本管理。
我切换回了自定义输出设置的主页面。在这里可以看到示例蓝图以及刚刚复制的蓝图列表,一目了然地管理和选择需要使用的蓝图。
UseCase
提供了三个使用场景,并为每个场景指出了应该选择"标准输出"、"自定义输出"或"两者结合"中的哪种方式:
- RAG 索引
- 智能文档处理
- 媒体分析
API
以下是关于通过 API 使用 BDA 的用户指南。通过调用已创建的项目 API,可以实现以下功能:
- 从非结构化多模态内容中提取有价值的信息
- 作为解析器,用于设置 RAG 工作流的知识库
总结
在实际操作中,我对 BDA 的使用有了以下几点认识:
- 项目:是标准输出和自定义输出设置的集合
- 蓝图:相当于自定义输出的"配方"
- 自定义输出界面:可以查看示例蓝图和自定义蓝图
- 演示界面:可以查看不同资产类型的标准输出和自定义输出结果,并验证修改设置后的效果
- API 调用:通过调用创建的项目 API,可从非结构化多模态内容中提取信息,或者在设置 RAG 工作流知识库时作为解析器使用