Azure OpenAI Embeddings vs OpenAI Embeddings

**题意:**Azure OpenAI 嵌入与 OpenAI 嵌入的比较

问题背景:

Is anyone getting different results from Azure OpenAI embeddings deployment using text-embedding-ada-002 than the ones from OpenAI? Same text, same model, and the results are considerably far in the vector space.

是否有人在使用Azure OpenAI部署的text-embedding-ada-002模型进行嵌入时,得到的结果与直接使用OpenAI得到的结果不同?即使是相同的文本和相同的模型,结果在向量空间中的差异也相当大。

What's recommended for embeddings? 嵌入(embeddings)的推荐是什么?

问题解决:

Current AOAI's text-embedding-ada-002 is somewhat different from OAI's. Our model currently supports only 2K tokens, while OAI can support 8K tokens.

当前AOAI的text-embedding-ada-002模型与OAI的有所不同。我们的模型目前仅支持2000个词元(tokens),而OAI可以支持8000个词元。

Azure OpenAI doesn't allow batched embeddings. You need to use multiple simultaneous requests. If you hit the maximum req/min, you will need to ask Azure a quota increase.

Azure OpenAI 不允许批量嵌入。您需要使用多个同时请求。如果您达到每分钟最大请求数限制,您需要向Azure申请配额增加。

相关推荐
寻星探路26 分钟前
【算法专题】哈希表:从“两数之和”到“最长连续序列”的深度解析
java·数据结构·人工智能·python·算法·ai·散列表
水中加点糖1 小时前
RagFlow实现多模态搜索(文、图、视频)与(关键字/相似度)搜索原理(二)
python·ai·音视频·knn·ragflow·多模态搜索·相似度搜索
-dcr1 小时前
50.智能体
前端·javascript·人工智能·ai·easyui
阿里巴巴P8资深技术专家1 小时前
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
ai·ocr·ai大模型·rag·文档解析·mineru·tike
向量引擎1 小时前
复刻“疯狂的鸽子”?用Python调用Sora2与Gemini-3-Pro实现全自动热点视频流水线(附源码解析)
开发语言·人工智能·python·gpt·ai·ai编程·api调用
太空眼睛2 小时前
【MCP】使用SpringBoot基于Streamable-HTTP构建MCP-Client
spring boot·ai·llm·sse·mcp·mcp-client·streamable
草帽lufei15 小时前
OpenAI API调用实践文本分类和内容生成
openai·agent
少林码僧16 小时前
2.29 XGBoost、LightGBM、CatBoost对比:三大梯度提升框架选型指南
人工智能·机器学习·ai·数据挖掘·数据分析·回归
xiucai_cs17 小时前
本地搭建 AI 翻译服务:LM Studio + STranslate/Bob
ai·机器翻译
Golang编程笔记17 小时前
电商数据分析的未来发展路径
ai·数据挖掘·数据分析