基于Azure OpenAI Service 的知识库搭建实验⼿册

1.概要
介绍如何使⽤Azure OpenAI Service 的嵌⼊技术,创建知识库;以及创建必要的资源组和资源,包括 Form Recognizer 资源和
Azure 翻译器资源。在创建问答机器⼈服务时,需要使⽤已部署模型的 Azure OpenAI 资源、已存在的表格识别资源和翻译资
源。通过 Azure ⾃定义资源模板创建服务,填写相应的参数即可。参数包括在您的 Azure OpenAI 资源上部署的指令引擎、在
Azure OpenAI 资源上部署的⽂档嵌⼊引擎、在 Azure OpenAI 资源上部署的查询嵌⼊引擎、您的 Azure OpenAI 资源名称、您的
Azure OpenAI API 密钥、 Redis Stack 的 URL 、 Azure Blob 存储连接字符串等。
嵌⼊是⼀种特殊的数据表⽰格式,可由机器学习模型和算法轻松使⽤。 嵌⼊是⼀段⽂本的语义含义的信息密集表⽰。 每个嵌⼊
是浮点数的⼀个向量,向量空间中两个嵌⼊之间的距离与原始格式的两个输⼊之间的语义相似性相关。 例如,如果两个⽂本相
似,则它们的向量表⽰形式也应该相似。
2. 实验步骤
本节主要描述了如何部署知识库问答服务的相关步骤。
2.1 创建必要的资源组和资源
本节主要是准备动作,创建好最终搭建服务所需要的资源。
2.1.1 创建资源组
Azure OpenAI 服务⽬前部署在 Azure 美东、美国中南部、⻄欧三个数据中⼼。因此,为了让相关资源配合运⾏时取得最低的时
延,建议将资源组以及内含的资源也创建在这三个数据中⼼之中。本例选择在美东数据中⼼创建全部资源和资源组。
以下是在 Azure 美东数据中⼼ (East US) 创建资源组的步骤:
登陆 Azure 管理界⾯ https://portal.azure.com ,选择左侧导航栏中的 " 资源组 " 选项
点击 "+ 新建 " 按钮,在弹出的新建资源组窗⼝中输⼊相关信息,包括资源组名称、订阅、区域等,区域选择美国东部

单击 " 查看 + 创建 " 以预览并创建资源组
2.1.2 创建 Azure OpenAI 资源
Azure OpenAI 资源是该解决⽅案的核⼼,需要率先创建 Azure OpenAI 资源才能实现对 OpenAI ⼤模型的部署,在 Azure Portal
中创建 Azure OpenAI 资源的步骤如下:
在资源组内,单击 "+ 添加 " 按钮,在弹出的菜单中选择 "Marketplace" 选项
在 "Marketplace" ⻚⾯中,搜索 "OpenAI" 并选择 "Azure OpenAI" 服务

点击 " 创建 " 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区、定价层等,地区选择 East US

点击 " 查看 + 创建 " 以预览并创建 Azure OpenAI 资源
创建完成后,访问 https://oai.azure.com ⻚⾯

在⻚⾯上点击新建部署按钮,创建 text-davinci-003 部署和 text-embedding-ada-002 部署

两个部署创建完成后,即意味着 OpenAI 资源已经准备就绪。
2.1.3 创建 Form Recognizer 资源
Azure Form Recognizer 的作⽤是⽤于从⽂档中提取表格、键值对等结构化数据。在本实验中,我们将使⽤ Form Recognizer 识
别知识库中的⽂本数据。创建 Form Recognizer 资源的步骤如下:
在资源组内,单击 "+ 添加 " 按钮,在弹出的菜单中选择 "Marketplace" 选项
在 "Marketplace" ⻚⾯中,搜索 "Form Recognizer" 并选择 " 表单识别器 " 服务

点击 " 创建 " 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US
点击 " 查看 + 创建 " 以预览并创建表单识别器资源
2.1.4 创建 Azure 翻译器资源
Azure 翻译器资源的作⽤是将⽂本翻译成不同的语⾔。在本实验中,我们将使⽤ Azure 翻译器将知识库中的⽂本翻译成多种语
⾔。创建 Azure 翻译器资源的步骤如下:
在资源组内,单击 "+ 添加 " 按钮,在弹出的菜单中选择 "Marketplace" 选项
在 "Marketplace" ⻚⾯中,搜索 "Azure 翻译器 " 并选择该服务

单击 " 创建 " 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US

单击 " 查看 + 创建 " 以预览并创建 Azure 翻译器资源

2.2创建知识库问答服务
此存储库使⽤ Azure OpenAI 服务从⽂档创建嵌⼊向量。 为了回答⽤户的问题,它检索最相关的⽂档,然后使⽤ GPT-3 提取问
题的匹配答案。
请注意,您需要:
拥有已部署模型的 Azure OpenAI 资源(例如 text-davinci-003 等指令模型和 text-embedding-ada-002 等嵌⼊模型)
拥有已存在的表格识别资源
拥有已存在的翻译资源
以下是通过 Azure ⾃定义资源模板创建服务的步骤:
在 Azure 管理界⾯中选择左侧导航栏中的 " 创建资源 " 选项
在弹出的 " 创建资源 " 窗⼝中输⼊ " 模板部署 " ,选择 " 模板部署 ( 使⽤⾃定义模板部署 )"

相关推荐
ChoSeitaku12 小时前
NO.3数据结构栈和队列|顺序栈|共享栈|链栈|顺序队|循环队列|链队|双端队列|括号匹配|中缀表达式转后缀|后缀表达式求值
数据结构·microsoft
LCG元16 小时前
MCP选型指南:AWS vs Azure vs GCP vs 国内云厂商深度对比
flask·azure·aws
干净的坏蛋17 小时前
Microsoft Word 中 .doc 和 .docx 的区别
microsoft·word
Leinwin1 天前
微软智能语音平台赋能理想汽车:创新驱动,引领智能出行新体验
microsoft
杰哥技术分享2 天前
宝塔 php支持sqlserver
microsoft
Linux运维技术栈2 天前
企业级配置:Azure 邮件与 Cloudflare 域名解析的安全验证落地详解
运维·安全·flask·azure·cloudflare
阿酷tony2 天前
微软语音合成标记语言SSML文档结构和事件(详细文档和实例)
microsoft·微软语音·ssml文档结构·ssml结构·ssml语音合成
qb_jiajia2 天前
2025年微软mos备考攻略-穷鬼版
microsoft·微软
FreeBuf_2 天前
微软365 PDF导出功能存在本地文件包含漏洞,可泄露敏感服务器数据
服务器·microsoft·pdf
Leinwin3 天前
微软上线 Deep Research 预览版:o3+必应赋能研究自动化
运维·microsoft·自动化