Elasticsearch:创建 tavily 网页搜索 workflow 及在 agent 中使用它

在今天的文章中,我将使用 tavily web search 来创建一个 workflow。当我们搜索一个知识库,如果搜索的结果不是很相关的情况下,那么,我们调佣这个 workflow,并在网页上搜索。最终展示的结果是从互联网上的知识,而不是简单的 "不知道" 这样的结果。我们使用 Elastic Stack 9.3+。

更多阅读:Agentic RAG 详解 - 从头开始​​构建你自己的智能体系统

写入数据到 Elasticsearch

我们可以参考之前的文章 "Agentic RAG 详解 - 从头开始​​构建你自己的智能体系统",把网页 https://em360tech.com/tech-articles/what-llama-3-everything-you-need-know-about-metas-new-ai 的数据写入到 Elasticsearch 中去。这个网页的知识只有关于 llama 3 的知识,而没有其它的知识。我们将在下面对这个建立起来的知识库进行搜索。

我们使用的代码是:https://github.com/liu-xiao-guo/twosetai/blob/main/13_agentic_rag_es_workflow.ipynb

在 Kibana 中创建如下的 workflow:

复制代码
# =============================================================================
# Workflow: 🔎 Web Search via Tavily
# Category: search
#
# This workflow is manually triggered and allows users to input a search query,
# defaulting to "what is the population of Malta?". It performs a web search using
# the Tavily API by sending a POST request with JSON payload and authorization.
# =============================================================================
name: 🔎 Web Search via Tavily
enabled: true

# ---------------------------------------------------------------------------
# TRIGGERS
# ---------------------------------------------------------------------------
triggers:
  - type: manual

# ---------------------------------------------------------------------------
# INPUTS
# ---------------------------------------------------------------------------
inputs:
  - name: query
    default: what is the population of Malta?
    description: query to pass into Tavily search
    type: string

# ---------------------------------------------------------------------------
# STEPS
# ---------------------------------------------------------------------------
steps:

  # -------------------------------------------------------------------------
  # STEP 1: tavily_search
  # -------------------------------------------------------------------------
  # Performs a web search using the Tavily API.
  - name: tavily_search
    type: http
    with:
      url: https://api.tavily.com/search
      method: POST
      headers:
        Content-Type: application/json
        Authorization: Bearer <Your Tavily API key>
      body: |
        {
          "query": "{{ inputs.query }}"
        }

  # -------------------------------------------------------------------------
  # STEP 2: Process each Tavily result
  # -------------------------------------------------------------------------
  - name: process_each_result
    type: foreach
    foreach: "{{ steps.tavily_search.output.data.results }}"
    steps:
      - name: log_result
        type: console
        with:
          message: |
            Title: {{ foreach.item.title }}
            URL: {{ foreach.item.url }}
            Content: {{ foreach.item.content }}

在上面,我们必须填入自己的 Tavily API key。这个 key 可以是免费的,针对开发者而言。

创建 search-for-llama 工具

复制代码
FROM agent_rag_index METADATA _score
| WHERE KNN(vector, TEXT_EMBEDDING( ?query, "azure_openai_embeddings"))
| SORT _score DESC
| LIMIT 5
| KEEP text

我们创建上面的 search-for-llama 工具。它使用向量搜索来搜索我们的知识库。

复制代码
This is the agent to search for general knowledge. Please justify the return result. If the returned result does not match the original question, please DO use Tavily web search to search on internet.

如上所示,当我们搜索到的结果不能和搜索的话题匹配的话,那么我们将自动使用 Tavily 搜索来搜索网页来得到结果。它包含如下的工具:

测试

我们使用如下的问题来进行提问:

如上所示,它生成的结果和问题匹配,所以它没有调用 Tavily 来进行搜索网页。

我们再次使用如下的话题来进行提问:

很显然,我们的知识库没有相应的知识。它最终调用 Tavily 网页搜索来查询到相应的知识。

最后,祝大家创建智能体愉快,也祝大家新春快乐!

相关推荐
山岚的运维笔记2 小时前
SQL Server笔记 -- 第55章:外键
数据库·笔记·sql·microsoft·sqlserver
wsfk12342 小时前
MySQL 数据库连接池爆满问题排查与解决
android·数据库·mysql
unirst19850072 小时前
Mysql官网下载Windows、Linux各个版本
linux·数据库·mysql
twilight_4692 小时前
人工智能数学基础——第二章 高等数学基础
人工智能·算法·机器学习
CS创新实验室2 小时前
结构性重塑:人工智能时代的软件工程将走向何方
人工智能·软件工程
Scabbards_2 小时前
深度学习性能分析/测试(AI Infra) 相关
人工智能·深度学习
Hello.Reader2 小时前
Flink 日志怎么用从“找得到”到“看得懂”,再到“可检索可关联”
大数据·flink
正宗咸豆花2 小时前
具身智能开源生态:小米机器人VLA模型如何推动物理AI产业化?
人工智能·机器人·开源