Azure - 尝试创建并使用一下Azure AI Search

1. 简单介绍

我们可以使用Azure AI Search作为向量的存储库,同时Azure AI Search也提供了keyword search, vector search和Hybrid search等功能。在Azure AI Search中有Index,Indexer, Skillset, Scale, Semantic Ranker等概念,具体的内容可以参考微软的mslearn文章

这边将尝试去创建一个Azure AI Search并以Rag的方式使用一下

  1. 在Azure portal 的Azure AI Foundry界面中,选择左侧的AI Search菜单,然后点击Create按钮,
  1. 在Create a search service界面中,选择subscription和pricing tier,同时设定search name,

note, 不同的pricing tier对应不同的capacity,费用也不同的。

  1. 最后在review界面中,点击create按钮,

4)最后创建成功

  1. 在Azure AI Search界面中,点击import data(new)按钮,
  1. 在Choose a data source界面中,选择Azure Blob Storage选项,
  1. 点击RAG选项,如下图所示,
  1. 在Connect to your data 界面中,选择Storage account和Blob container

note, 这边假定已经创建了一个Azure blob storage,用于存放resumes,

  1. 在Vectorize your text界面,选择Azure OpenAI service和embeding model,这边在Authentication type中选择的是API key,
  1. 下面的界面没有设置值,当前这边没有用的OCR等Azure AI Skillset,
  1. 在Advance settings中,选择Enable semantic ranker
  1. 在review and create界面中,点击Create按钮,
  1. 弹出如下界面,表示创建成功了,
  1. 在创建的Azure AI Search index 的 Fields界面中,发现有vector field 产生,
  1. 在Search explorer中,直接点击Search按钮,发现有内容返回

2.3 记录配置信息

创建好Azure AI Search之后,需要记录一下Azure AI Search对应的endpoint和key,

  1. Endpoint信息,

​​​​​​​

  1. key信息,

3. 制作Custom Engine Agent

3.1 创建项目

  1. 假定在VSCode中已经安装了Microsoft 365 Agents Toolkit,以前的名字是Teams Toolkit,
  1. 创建了一个Custom Engine Agent,
  1. 选择 Basic AI Chatbot,
  1. 选择Typescript语言,
  1. 配置Azure Open AI key, endpoint等信息
  1. 最后创建了一个Custom Agent,如下图所示,

7)定制项目并配置Azure AI Search的endpoint, key, index name, embeding model等信息,

3.2 运行项目

  1. 在VSCode的项目中,点击RUN AND DEBUG下拉框,选择Debug in Teams(Desktop)并运行,
  1. 启动项目的过程中会弹出下面的提示窗,点击Continue按钮,
  1. 在弹出的如下Teams App窗口中,点击Add按钮,
  1. 在下面的界面中,点击Open按钮,
  1. 最后输入想提问的问题,bot会通过Azure AI Search的vector search进行内容检索,并将检索结果提供给Azure Open AI作为上下文, 最后返回内容给bot同时bot返回内容给用户,如下图所示,

4. 总结

本文记录了一下创建Azure AI Search并以RAG的方式来使用Azure AI Search的过程。在别的Vector storage中也有和Azure AI Search对应的概念的,比如Qdrant中Collection对应的是AI Search中的Index,Payload对应的是Fields等。不过相对其他的RAG解决方案,Azure AI Search的可拓展性可能比较强一些,支持partion和replicas的两种拓展方式。更加详细的内容,还可以参考微软的mslearn文章​​​​​​​。

本文如果哪里有错误,麻烦告之,谢谢谢谢!

相关推荐
步步为营DotNet7 小时前
深入剖析.NET 11 中 Microsoft.Extensions.AI 在 AI 驱动后端开发的进阶应用
人工智能·microsoft·.net
Java后端的Ai之路9 小时前
Playwright是微软开源的浏览器自动化库:从入门到精通的实战指南
运维·microsoft·自动化·浏览器自动化·playwright
LINgZone21 天前
Java Mock 测试框架 Mockito
java·windows·microsoft
coderlin_1 天前
langchain 基础
microsoft·langchain
王哥儿聊AI1 天前
微软开源神器MarkItDown:一键把PPT/PDF/Excel转成markdown,LLM直呼内行!
人工智能·深度学习·microsoft·机器学习·开源·powerpoint
love530love1 天前
【独家资源】Windows 本地部署微软 BitNet b1.58: Flash Attention + CUDA GPU 加速 (sm_86) + AVX2 优化 + 1.58bit 量化
人工智能·windows·microsoft·llama.cpp·bitnet·flash attention·bitlinear_cpp
月亮!1 天前
6大AI测试工具极限压测:微软TuringAI竟率先崩溃
java·人工智能·python·测试工具·microsoft·云原生·压力测试
YJlio1 天前
《Windows 11 从入门到精通》读书笔记 1.4.9:全新的微软应用商店——“库 + 多设备同步”把它从鸡肋变成刚需入口
c语言·网络·python·数码相机·microsoft·ios·iphone
梦玄诗1 天前
微软常用运行库2025.12.03
microsoft
深耕AI1 天前
【一招根治】彻底退出Windows 10/11微软账户
windows·microsoft