Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!

在当前多模态 AI 和大模型技术风头正劲的背景下,Jina AI 始终领跑于创新前沿,技术领先。2023 年 10 月 30 日,Jina AI 隆重推出 jina-embeddings-v2,这是全球首款支持 8192 输入长度的开源向量大模型,其性能媲美 OpenAI 的闭源 text-embedding-ada002。如今,jina-embeddings-v2 正式登陆 AWS Marketplace,为中大型企业提供了私有化部署向量模型的理想解决方案。

作为亚马逊云科技创业加速器的一员,Jina AI 与 AWS 的密切合作体现了双方在推动 AI 技术发展上的共同承诺。这次合作不仅在技术层面上实现了联合,更是对未来大模型应用落地的深入探索。

Jina AI 的创始人兼 CEO 肖涵博士,对此表示: "jina-embeddings-v2 上线 AWS Marketplace,是对私有化 AI 解决方案行业标准的一次重大推进。"
现在,企业用户可以在 AWS Marketplace 上搜索 jina-embeddings-v2-base/small,并将它们直接部署到自己的 AWS 账户中。

AWS SageMaker 的无缝集成

在 Jina AI,我们不仅追求技术创新,更重视其在 实际应用中的高效实施。因此我们将 jina-embeddings-v2 与 AWS SageMaker 进行了无缝集成,为企业用户提供了一种高效便捷的解决方案。企业用户现在可以轻松地将 jina-embeddings-v2 模型直接部署为 SageMaker 终端节点,迅速应用到实际业务中,无需担忧技术复杂性和部署挑战。

在商业应用方面,我们特别注重 经济性和隐私保护。我们的英语 Base 模型和 Small 模型无需额外许可费,客户仅需承担 AWS 实例相关费用。这不仅确保了在 Virtual Private Cloud(VPC)内的数据隐私和安全,同时也提供了成本效益极高的解决方案。

此外,我们为不同业务场景提供多元化的选择。0.27 GB 的 Base 模型和 0.07 GB 的 Small 模型,能够服务从深度数据分析到轻量级应用的多样化需求。其中,Base 模型以其全面的语义表示能力,非常适合企业级搜索和内容推荐。而专门针对移动和边缘设备优化的 Small 模型,则突出了在速度和效率上的优势。

jina-embeddings-v2 的独特优势

  1. RAG 应用的理想选择:我们深知长文本处理的复杂性,特别是在需要广泛信息搜集和深度理解的场景中。jina-embeddings-v2 支持不同语义粒度的完整文本表示,使其成为优化 RAG 应用中处理长篇文本的理想选择。它不仅增强了文本的语义理解能力,还提供了更大的灵活性和准确性。

  2. 全球首个支持 8k 输入长度的开源模型:jina-embeddings-v2 作为全球首个支持高达 8k 输入长度的开源模型,它在多方面比肩 OpenAI 的闭源模型 text-embedding-ada-002。我们的开源模型不仅具有强大的性能,更重要的是,它为用户提供了根据自己的业务需求进行个性化调整的自由度。

  3. 更小的维度实现高效的表征:在保持与 OpenAI 的 text-embedding-ada-002 模型相当的性能表现的同时,jina-embeddings-v2 的向量维度仅为其一半,大幅降低了存储需求并提高了检索速度。

开始使用 AWS 上的 jina-embeddings-v2

要开始使用 jina-embeddings-v2,请访问 AWS Marketplace 列表并选择最适合您需求的模型。

🔗:https://aws.amazon.com/marketplace/seller-profile?id=seller-stch2ludm6vgy

以下示例可帮助您开始使用 jina-embeddings-v2 模型:

  1. Sagemaker 的实时推理https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Real-time inference.ipynb

  2. 使用 SageMaker 批量向量化https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Batch transform.ipynb

即将推出多语言向量模型

Jina AI 正在积极开发多语言向量模型,包括中英双语、德英双语的向量模型。供企业客户在各种云服务提供商(CSP)上进行私有化部署,为全球客户提供更加全面和灵活的 AI 解决方案。随着这些模型的推出,不仅将跨越语言障碍,更将为企业解锁全球机遇。

相关推荐
hunter2062064 分钟前
用opencv生成视频流,然后用rtsp进行拉流显示
人工智能·python·opencv
Daphnis_z6 分钟前
大模型应用编排工具Dify之常用编排组件
人工智能·chatgpt·prompt
yuanbenshidiaos1 小时前
【大数据】机器学习----------强化学习机器学习阶段尾声
人工智能·机器学习
好评笔记6 小时前
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
算家云6 小时前
TangoFlux 本地部署实用教程:开启无限音频创意脑洞
人工智能·aigc·模型搭建·算家云、·应用社区·tangoflux
叫我:松哥8 小时前
基于Python django的音乐用户偏好分析及可视化系统设计与实现
人工智能·后端·python·mysql·数据分析·django
熊文豪9 小时前
深入解析人工智能中的协同过滤算法及其在推荐系统中的应用与优化
人工智能·算法
Vol火山9 小时前
AI引领工业制造智能化革命:机器视觉与时序数据预测的双重驱动
人工智能·制造
tuan_zhang10 小时前
第17章 安全培训筑牢梦想根基
人工智能·安全·工业软件·太空探索·战略欺骗·算法攻坚
Antonio91510 小时前
【opencv】第10章 角点检测
人工智能·opencv·计算机视觉