Elasticsearch:创建 tavily 网页搜索 workflow 及在 agent 中使用它

在今天的文章中,我将使用 tavily web search 来创建一个 workflow。当我们搜索一个知识库,如果搜索的结果不是很相关的情况下,那么,我们调佣这个 workflow,并在网页上搜索。最终展示的结果是从互联网上的知识,而不是简单的 "不知道" 这样的结果。我们使用 Elastic Stack 9.3+。

更多阅读:Agentic RAG 详解 - 从头开始​​构建你自己的智能体系统

写入数据到 Elasticsearch

我们可以参考之前的文章 "Agentic RAG 详解 - 从头开始​​构建你自己的智能体系统",把网页 https://em360tech.com/tech-articles/what-llama-3-everything-you-need-know-about-metas-new-ai 的数据写入到 Elasticsearch 中去。这个网页的知识只有关于 llama 3 的知识,而没有其它的知识。我们将在下面对这个建立起来的知识库进行搜索。

我们使用的代码是:https://github.com/liu-xiao-guo/twosetai/blob/main/13_agentic_rag_es_workflow.ipynb

在 Kibana 中创建如下的 workflow:

复制代码
# =============================================================================
# Workflow: 🔎 Web Search via Tavily
# Category: search
#
# This workflow is manually triggered and allows users to input a search query,
# defaulting to "what is the population of Malta?". It performs a web search using
# the Tavily API by sending a POST request with JSON payload and authorization.
# =============================================================================
name: 🔎 Web Search via Tavily
enabled: true

# ---------------------------------------------------------------------------
# TRIGGERS
# ---------------------------------------------------------------------------
triggers:
  - type: manual

# ---------------------------------------------------------------------------
# INPUTS
# ---------------------------------------------------------------------------
inputs:
  - name: query
    default: what is the population of Malta?
    description: query to pass into Tavily search
    type: string

# ---------------------------------------------------------------------------
# STEPS
# ---------------------------------------------------------------------------
steps:

  # -------------------------------------------------------------------------
  # STEP 1: tavily_search
  # -------------------------------------------------------------------------
  # Performs a web search using the Tavily API.
  - name: tavily_search
    type: http
    with:
      url: https://api.tavily.com/search
      method: POST
      headers:
        Content-Type: application/json
        Authorization: Bearer <Your Tavily API key>
      body: |
        {
          "query": "{{ inputs.query }}"
        }

  # -------------------------------------------------------------------------
  # STEP 2: Process each Tavily result
  # -------------------------------------------------------------------------
  - name: process_each_result
    type: foreach
    foreach: "{{ steps.tavily_search.output.data.results }}"
    steps:
      - name: log_result
        type: console
        with:
          message: |
            Title: {{ foreach.item.title }}
            URL: {{ foreach.item.url }}
            Content: {{ foreach.item.content }}

在上面,我们必须填入自己的 Tavily API key。这个 key 可以是免费的,针对开发者而言。

创建 search-for-llama 工具

复制代码
FROM agent_rag_index METADATA _score
| WHERE KNN(vector, TEXT_EMBEDDING( ?query, "azure_openai_embeddings"))
| SORT _score DESC
| LIMIT 5
| KEEP text

我们创建上面的 search-for-llama 工具。它使用向量搜索来搜索我们的知识库。

复制代码
This is the agent to search for general knowledge. Please justify the return result. If the returned result does not match the original question, please DO use Tavily web search to search on internet.

如上所示,当我们搜索到的结果不能和搜索的话题匹配的话,那么我们将自动使用 Tavily 搜索来搜索网页来得到结果。它包含如下的工具:

测试

我们使用如下的问题来进行提问:

如上所示,它生成的结果和问题匹配,所以它没有调用 Tavily 来进行搜索网页。

我们再次使用如下的话题来进行提问:

很显然,我们的知识库没有相应的知识。它最终调用 Tavily 网页搜索来查询到相应的知识。

最后,祝大家创建智能体愉快,也祝大家新春快乐!

相关推荐
zhangren02468几秒前
Laravel7.x新特性全面解析
数据库·mysql·adb·php
维度攻城狮2 分钟前
Docker 部署 Dify,快速私有化搭建专属知识库问答
人工智能·docker·部署·dify·知识问答
鸽芷咕4 分钟前
Oracle替换工程实践深度解析:金仓数据库破解PL/SQL“零改造”迁移难题
数据库·sql·oracle
Fzuim4 分钟前
写给 AI 的散文:意图式提示词写作指南
人工智能·ai·prompt·提示词
猿小喵5 分钟前
MySQL数据库参数解读-第一篇
数据库·mysql·性能优化
GISer_Jing5 分钟前
12节课拆解AI编程Agent核心原理
ai·aigc·ai编程
云边有个稻草人9 分钟前
数据库性能调优实战:从瓶颈诊断到落地优化
网络·数据库·oracle·金仓·kes
小陈工10 分钟前
Python Web开发入门(二):Flask vs Django,项目结构大比拼
前端·数据库·python·安全·web安全·django·flask
LuoQuHen11 分钟前
第二章:Agent的“大脑“从何而来?—— 从规则引擎到LLM的进化史
人工智能·ai·chatgpt·agent
杜子不疼.12 分钟前
2026 GitHub 热门 Python 项目:AI 代理与数据工具精选
人工智能·python·github