使用 Vertex AI Gemini 模型和 Elasticsearch Playground 快速创建 RAG 应用程序

作者:来自 Elastic Jeff Vestal

在这篇博客中,我们将使用 Elastic 的 Playground 和 Vertex AI API 将 Elasticsearch 连接到 Google 的 Gemini 1.5 聊天模型。将 Gemini 模型添加到 Playground 使 Google Cloud 开发人员能够快速建立 LLM、测试检索、调整分块并使用 Elastic 将 gen AI 搜索应用程序交付到生产环境。

你需要一个启动并运行的 Elasticsearch 集群。我们将在 Elastic Cloud 上使用 serverless 项目。如果你没有帐户,可以注册免费试用

你还需要一个启用了 Vertex AI 的 Google Cloud 帐户。如果你没有 Google Cloud 帐户,可以注册免费试用

配置 Vertex AI

首先,我们将配置一个 Vertex AI 服务帐户,这将允许我们安全地从 Elasticsearch 向 Gemini 模型进行 API 调用。你可以按照此处 Google Cloud 文档页面上的详细说明进行操作,但我们将介绍要点。

转到 Google Cloud 控制台的 " Create Service Account" 部分。在那里,选择已启用 Vertex AI 的项目。

接下来,为你的服务帐户命名,并可选地提供描述。点击 "Create and Continue"。

为你的项目设置访问控制。对于本博客,我们使用了 "Vertex AI User" 角色,但你需要确保你的访问控制适合你的项目和帐户。

单击 "Done"。

Google Cloud 中的最终设置是为服务帐户创建 API 密钥并以 JSON 格式下载。

单击服务帐户中的 "KEYS ",然后单击 "ADD KEY " 和 "Create New"。

确保选择 "json " 作为密钥类型,然后单击 "CREATE"。

密钥将被创建并自动下载到你的计算机。我们将在下一节中需要此密钥。

从 Playground 连接到你的 LLM

配置 Google Cloud 后,我们可以继续在 Elastic 的 Playground 中配置 Gemini LLM 连接。

本博客假设你已经在 Elasticsearch 中拥有要与 Playground 一起使用的数据。如果没有,请按照搜索实验室博客 Playground:在几分钟内使用 Elasticsearch 试验 RAG 应用程序以开始使用

在 Kibana 中,从侧面导航菜单中选择 Playground。在 Serverless 中,它位于 "Build " 标题下。首次打开时,你可以选择 "Connect to an LLM"。

选择 "Google Gemini"

填写表格以完成配置。

打开上一节创建并下载的 JSON 凭证文件,复制完整的 JSON,并将其粘贴到 "Credentials JSON " 部分。然后点击 "Save"

现在是 Playground 时间!

Elastic 的 Playground 允许你在集成到完整代码之前尝试 RAG 上下文设置和系统提示。

通过在与模型聊天时更改设置,你可以看到哪些设置将为你的应用程序提供最佳响应。

此外,配置搜索 Elasticsearch 数据中的哪些字段以将上下文添加到你的聊天完成请求中。添加上下文将有助于巩固模型并提供更准确的响应。

此步骤使用 Elastic 的 ELSER 稀疏嵌入模型(内置),通过语义搜索检索上下文,并将其传递给 Gemini 模型。

就这些(目前)

对话式搜索是一个令人兴奋的领域,开发人员正在使用强大的大型语言模型(例如 Google Vertex AI 提供的模型)来构建新的体验。Playground 简化了原型设计和调整过程,使你能够更快地交付应用程序。

探索更多使用 Elasticsearch 和 Google Vertex AI 构建的想法,祝你搜索愉快!

准备好自己尝试一下了吗?开始免费试用

想要获得 Elastic 认证吗?了解下一期 Elasticsearch 工程师培训何时开始!

原文:Quickly iterate chat apps on Elasticsearch playground with Google Cloud Gemini models --- Search Labs

相关推荐
zhangrelay10 分钟前
如何使用AI快速编程实现标注ROS2中sensor_msgs/msg/Image图像色彩webots2025a
人工智能·笔记·opencv·学习·计算机视觉·机器人视觉
武子康13 分钟前
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
大千AI助手37 分钟前
LIFT:基于低秩引导的稀疏微调
人工智能·神经网络·lora·大模型·lift·大千ai助手·稀疏微调
Serverless 社区38 分钟前
算力成本降低 33%,与光同尘用 Serverless AI 赋能影视商业内容生产
人工智能·云原生·serverless
L.EscaRC40 分钟前
【AI基础篇】Transformer架构深度解析与前沿应用
人工智能·深度学习·transformer
王中阳Go1 小时前
3 - RAG 知识库基础 - AI 超级智能体项目教程
人工智能·agent
司马阅-SmartRead1 小时前
司马阅与数之境科技达成生态战略合作,释放1+1>2的产业赋能价值
人工智能
化作星辰1 小时前
四层神经网络案例(含反向传播)
人工智能·深度学习·神经网络
m0_650108241 小时前
【论文精读】AVID:基于扩散模型的任意长度视频修复
人工智能·扩散模型·论文精读·视频修复·时序一致性·任意时长·结构引导
TYUT_xiaoming1 小时前
ubuntu22.04 GPU环境安装mindspore
linux·人工智能·深度学习