Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!

在当前多模态 AI 和大模型技术风头正劲的背景下,Jina AI 始终领跑于创新前沿,技术领先。2023 年 10 月 30 日,Jina AI 隆重推出 jina-embeddings-v2,这是全球首款支持 8192 输入长度的开源向量大模型,其性能媲美 OpenAI 的闭源 text-embedding-ada002。如今,jina-embeddings-v2 正式登陆 AWS Marketplace,为中大型企业提供了私有化部署向量模型的理想解决方案。

作为亚马逊云科技创业加速器的一员,Jina AI 与 AWS 的密切合作体现了双方在推动 AI 技术发展上的共同承诺。这次合作不仅在技术层面上实现了联合,更是对未来大模型应用落地的深入探索。

Jina AI 的创始人兼 CEO 肖涵博士,对此表示: "jina-embeddings-v2 上线 AWS Marketplace,是对私有化 AI 解决方案行业标准的一次重大推进。"
现在,企业用户可以在 AWS Marketplace 上搜索 jina-embeddings-v2-base/small,并将它们直接部署到自己的 AWS 账户中。

AWS SageMaker 的无缝集成

在 Jina AI,我们不仅追求技术创新,更重视其在 实际应用中的高效实施。因此我们将 jina-embeddings-v2 与 AWS SageMaker 进行了无缝集成,为企业用户提供了一种高效便捷的解决方案。企业用户现在可以轻松地将 jina-embeddings-v2 模型直接部署为 SageMaker 终端节点,迅速应用到实际业务中,无需担忧技术复杂性和部署挑战。

在商业应用方面,我们特别注重 经济性和隐私保护。我们的英语 Base 模型和 Small 模型无需额外许可费,客户仅需承担 AWS 实例相关费用。这不仅确保了在 Virtual Private Cloud(VPC)内的数据隐私和安全,同时也提供了成本效益极高的解决方案。

此外,我们为不同业务场景提供多元化的选择。0.27 GB 的 Base 模型和 0.07 GB 的 Small 模型,能够服务从深度数据分析到轻量级应用的多样化需求。其中,Base 模型以其全面的语义表示能力,非常适合企业级搜索和内容推荐。而专门针对移动和边缘设备优化的 Small 模型,则突出了在速度和效率上的优势。

jina-embeddings-v2 的独特优势

  1. RAG 应用的理想选择:我们深知长文本处理的复杂性,特别是在需要广泛信息搜集和深度理解的场景中。jina-embeddings-v2 支持不同语义粒度的完整文本表示,使其成为优化 RAG 应用中处理长篇文本的理想选择。它不仅增强了文本的语义理解能力,还提供了更大的灵活性和准确性。

  2. 全球首个支持 8k 输入长度的开源模型:jina-embeddings-v2 作为全球首个支持高达 8k 输入长度的开源模型,它在多方面比肩 OpenAI 的闭源模型 text-embedding-ada-002。我们的开源模型不仅具有强大的性能,更重要的是,它为用户提供了根据自己的业务需求进行个性化调整的自由度。

  3. 更小的维度实现高效的表征:在保持与 OpenAI 的 text-embedding-ada-002 模型相当的性能表现的同时,jina-embeddings-v2 的向量维度仅为其一半,大幅降低了存储需求并提高了检索速度。

开始使用 AWS 上的 jina-embeddings-v2

要开始使用 jina-embeddings-v2,请访问 AWS Marketplace 列表并选择最适合您需求的模型。

🔗:https://aws.amazon.com/marketplace/seller-profile?id=seller-stch2ludm6vgy

以下示例可帮助您开始使用 jina-embeddings-v2 模型:

  1. Sagemaker 的实时推理https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Real-time inference.ipynb

  2. 使用 SageMaker 批量向量化https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Batch transform.ipynb

即将推出多语言向量模型

Jina AI 正在积极开发多语言向量模型,包括中英双语、德英双语的向量模型。供企业客户在各种云服务提供商(CSP)上进行私有化部署,为全球客户提供更加全面和灵活的 AI 解决方案。随着这些模型的推出,不仅将跨越语言障碍,更将为企业解锁全球机遇。

相关推荐
池央28 分钟前
AI性能极致体验:通过阿里云平台高效调用满血版DeepSeek-R1模型
人工智能·阿里云·云计算
我们的五年29 分钟前
DeepSeek 和 ChatGPT 在特定任务中的表现:逻辑推理与创意生成
人工智能·chatgpt·ai作画·deepseek
Yan-英杰30 分钟前
百度搜索和文心智能体接入DeepSeek满血版——AI搜索的新纪元
图像处理·人工智能·python·深度学习·deepseek
Fuweizn32 分钟前
富唯智能可重构柔性装配产线:以智能协同赋能制造业升级
人工智能·智能机器人·复合机器人
weixin_307779132 小时前
Azure上基于OpenAI GPT-4模型验证行政区域数据的设计方案
数据仓库·python·云计算·aws
taoqick2 小时前
对PosWiseFFN的改进: MoE、PKM、UltraMem
人工智能·pytorch·深度学习
suibian52353 小时前
AI时代:前端开发的职业发展路径拓宽
前端·人工智能
预测模型的开发与应用研究4 小时前
数据分析的AI+流程(个人经验)
人工智能·数据挖掘·数据分析
源大模型4 小时前
OS-Genesis:基于逆向任务合成的 GUI 代理轨迹自动化生成
人工智能·gpt·智能体
PowerBI学谦5 小时前
Python in Excel高级分析:一键RFM分析
大数据·人工智能·pandas