Azure AI Search 探索总结

Azure AI Search 原名 Azure Cognitive Service,是Azure中用来给AI项目构建知识库的组件。

知识库本质和数据库很像,但是内部的存储结构和检索算法不一样。

比如并不是知识库的每一列都可以用来过滤、检索或group by,而是要根据实际情况配置。

Azure AI Search几个基本概念介绍:

  1. Index就是类似数据库的一张表,里面可以存放被检索的信息集合。
  2. Indexer索引生成器,从数据源读取并生成Index的生成器。
  3. 数据源,可以是Blob,Database
  4. Skillset,这个很有意思叫技能包,默认的索引生成器功能很简单,对于复杂文档,比如有大量图片的文档,视频或音频,在生成index时要动用到一些独特的技能包即Skillset

在Azure Portal里AI Search提供了Index的在线查询,使用的是它自己定义的一套JSON查询语法,这里给到几个经典查询介绍:

javascript 复制代码
// 查询某个可以facet的字段,有哪些distinct值
{
  "search": "*",          // 或空字符串
  "top": 0,               // 不返回具体文档
  "facets": ["category,count:1000"]  // 你想看 distinct 值的字段,默认显示10条,通过count指定数量上限
}


//限制返回字段content的上下文
{
  "search": "机器学习",
  "highlight": "content-40",   // 40=返回前/后各 40 个字符
  "select": "title,url"        // 不返回整段 content
}

//根据某个字段过滤,类似SQL中的where
{
  "filter": "category eq 'Electronics'",
  "select": "id,name,price"
}

最后补充两点:

  1. Azure AI Search Free-tier 只支持16MB以下的文档。

  2. Azure Portal里的操作方式: 不支持自定义index结构,复杂场景还是要写代码导入。

  3. Storage Blob里配置文件的元属性,AI Search也能自动读到。

相关推荐
AI-Frontiers26 分钟前
RAG系列:#6 一文搞懂RAG存储技术:文件、元数据、切片、向量
rag
菜到离谱但坚持3 小时前
零门槛学LangChain:AI开发从入门到实战
python·langchain·prompt·rag
Devin~Y6 小时前
智慧物流+AIGC客服Java大厂面试:Spring Boot、Kafka、Redis、JVM与RAG Agent实战
java·jvm·spring boot·redis·spring cloud·kafka·rag
小白狮ww18 小时前
个人学习助手 DeepTutor:把论文检索、做题和学习规划一次打通
人工智能·知识库·多智能体·rag·ai学习工具·deeptutor·交互式学习
敲个大西瓜1 天前
RAG(二)
rag
不爱洗脚的小滕1 天前
【RAG】Milvus 混合检索参数调优:ef / candidate_k / final_k 详解
网络·langchain·milvus·rag
codefan※1 天前
RAG 加速指南:Faiss / Milvus / Qdrant 向量库选型与调优
知识图谱·milvus·faiss·向量数据库·rag·qdrant
abigale031 天前
LangChain 实践4: 7个人AI助手全栈项目:完整拆解+分阶段开发指南
缓存·langchain·prompt·token·rag·lcel
程序员三明治1 天前
【AI】RAG 数据分块(Chunk)策略与实践
java·人工智能·后端·ai·大模型·llm·rag
咖啡星人k1 天前
长亭百智云:全新一代AI基础服务平台深度解读
大数据·人工智能·架构·rag·mcp·百智云