Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!

在当前多模态 AI 和大模型技术风头正劲的背景下,Jina AI 始终领跑于创新前沿,技术领先。2023 年 10 月 30 日,Jina AI 隆重推出 jina-embeddings-v2,这是全球首款支持 8192 输入长度的开源向量大模型,其性能媲美 OpenAI 的闭源 text-embedding-ada002。如今,jina-embeddings-v2 正式登陆 AWS Marketplace,为中大型企业提供了私有化部署向量模型的理想解决方案。

作为亚马逊云科技创业加速器的一员,Jina AI 与 AWS 的密切合作体现了双方在推动 AI 技术发展上的共同承诺。这次合作不仅在技术层面上实现了联合,更是对未来大模型应用落地的深入探索。

Jina AI 的创始人兼 CEO 肖涵博士,对此表示: "jina-embeddings-v2 上线 AWS Marketplace,是对私有化 AI 解决方案行业标准的一次重大推进。"
现在,企业用户可以在 AWS Marketplace 上搜索 jina-embeddings-v2-base/small,并将它们直接部署到自己的 AWS 账户中。

AWS SageMaker 的无缝集成

在 Jina AI,我们不仅追求技术创新,更重视其在 实际应用中的高效实施。因此我们将 jina-embeddings-v2 与 AWS SageMaker 进行了无缝集成,为企业用户提供了一种高效便捷的解决方案。企业用户现在可以轻松地将 jina-embeddings-v2 模型直接部署为 SageMaker 终端节点,迅速应用到实际业务中,无需担忧技术复杂性和部署挑战。

在商业应用方面,我们特别注重 经济性和隐私保护。我们的英语 Base 模型和 Small 模型无需额外许可费,客户仅需承担 AWS 实例相关费用。这不仅确保了在 Virtual Private Cloud(VPC)内的数据隐私和安全,同时也提供了成本效益极高的解决方案。

此外,我们为不同业务场景提供多元化的选择。0.27 GB 的 Base 模型和 0.07 GB 的 Small 模型,能够服务从深度数据分析到轻量级应用的多样化需求。其中,Base 模型以其全面的语义表示能力,非常适合企业级搜索和内容推荐。而专门针对移动和边缘设备优化的 Small 模型,则突出了在速度和效率上的优势。

jina-embeddings-v2 的独特优势

  1. RAG 应用的理想选择:我们深知长文本处理的复杂性,特别是在需要广泛信息搜集和深度理解的场景中。jina-embeddings-v2 支持不同语义粒度的完整文本表示,使其成为优化 RAG 应用中处理长篇文本的理想选择。它不仅增强了文本的语义理解能力,还提供了更大的灵活性和准确性。

  2. 全球首个支持 8k 输入长度的开源模型:jina-embeddings-v2 作为全球首个支持高达 8k 输入长度的开源模型,它在多方面比肩 OpenAI 的闭源模型 text-embedding-ada-002。我们的开源模型不仅具有强大的性能,更重要的是,它为用户提供了根据自己的业务需求进行个性化调整的自由度。

  3. 更小的维度实现高效的表征:在保持与 OpenAI 的 text-embedding-ada-002 模型相当的性能表现的同时,jina-embeddings-v2 的向量维度仅为其一半,大幅降低了存储需求并提高了检索速度。

开始使用 AWS 上的 jina-embeddings-v2

要开始使用 jina-embeddings-v2,请访问 AWS Marketplace 列表并选择最适合您需求的模型。

🔗:https://aws.amazon.com/marketplace/seller-profile?id=seller-stch2ludm6vgy

以下示例可帮助您开始使用 jina-embeddings-v2 模型:

  1. Sagemaker 的实时推理https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Real-time inference.ipynb

  2. 使用 SageMaker 批量向量化https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Batch transform.ipynb

即将推出多语言向量模型

Jina AI 正在积极开发多语言向量模型,包括中英双语、德英双语的向量模型。供企业客户在各种云服务提供商(CSP)上进行私有化部署,为全球客户提供更加全面和灵活的 AI 解决方案。随着这些模型的推出,不仅将跨越语言障碍,更将为企业解锁全球机遇。

相关推荐
weixin_437497771 小时前
读书笔记:Context Engineering 2.0 (上)
人工智能·nlp
喝拿铁写前端1 小时前
前端开发者使用 AI 的能力层级——从表面使用到工程化能力的真正分水岭
前端·人工智能·程序员
goodfat1 小时前
Win11如何关闭自动更新 Win11暂停系统更新的设置方法【教程】
人工智能·禁止windows更新·win11优化工具
北京领雁科技1 小时前
领雁科技反洗钱案例白皮书暨人工智能在反洗钱系统中的深度应用
人工智能·科技·安全
落叶,听雪1 小时前
河南建站系统哪个好
大数据·人工智能·python
清月电子2 小时前
杰理AC109N系列AC1082 AC1074 AC1090 芯片停产替代及资料说明
人工智能·单片机·嵌入式硬件·物联网
Dev7z2 小时前
非线性MPC在自动驾驶路径跟踪与避障控制中的应用及Matlab实现
人工智能·matlab·自动驾驶
七月shi人2 小时前
AI浪潮下,前端路在何方
前端·人工智能·ai编程
无奈笑天下2 小时前
【麒麟镜像vmtools异常排查指导书】
linux·运维·经验分享·云计算·kylin
橙汁味的风2 小时前
1隐马尔科夫模型HMM与条件随机场CRF
人工智能·深度学习·机器学习