Live Search API :给大模型装了一个“实时搜索引擎”的插件

6月5号前免费使用。

Live Search 是一项xAI API功能,允许 LLM 在生成响应时查询和考虑实时数据。通过此功能,您可以直接从 API 获得包含实时数据的聊天响应,而无需自己协调网络搜索和大型语言模型(LLM)工具调用。

可以把 Live Search 理解成给大模型装了一个"实时搜索引擎"的插件。但是,这个插件不能无脑地、一刀切地用,得有一些开关和调节器,这就是参数的作用。

以下是关键参数的设计思路:

  1. 总开关和使用模式 (search_parameters 字段里的 "mode")
  • 设计目的:

    不是所有对话都需要实时信息。有时只需要模型本身的知识,有时则必须用最新数据。所以得有个总开关,并且提供不同的使用模式。

  • "off" (关闭):

    就像说"这次聊天你别上网查了,就用你知道的回答就行"。这样可以确保回复的稳定性,也可能更快,适合不需要实时性的场景。

  • "on" (开启):

    相当于强行要求模型"去,给我查最新消息!"。适用于用户明确知道自己需要最新信息的情况,比如问"今天头条新闻是啥?"

  • "auto" (自动,也是默认设置):

    这个模式最"懒人友好"。就像告诉模型:"你看看用户问的问题,要是觉得上网查查能回答得更好、更准,你就去查;要是光凭你自己的知识库就够了,那就算了。" 这是默认设置,说明产品经理认为大多数情况下让模型自己判断是最方便、最合理的。

  • 为什么放在 search_parameters 字段里?

    把所有搜索相关的设置打包放在一个地方,让 API 请求结构更清晰,也方便管理。

  • 数据源选择 ("sources")

    • 设计目的:

      实时信息有很多来源:普通网页、社交媒体 (X)、新闻网站、甚至特定的 RSS Feed。用户可能只关心特定来源的信息。

    • 设计方式:

      允许用户指定一个列表,告诉模型"你搜索的时候,只考虑从这些地方找信息"。

    • 默认设置:

      如果用户不指定,默认会去"网页"和"X"上找。这是因为网页和 X 通常包含最广泛、最实时的信息类型,覆盖面广。

    • 支持的来源类型:

      提供了 "web" (普通网页)、"x" (X 帖子)、"news" (新闻源)、"rss" (RSS Feed)。每种来源都有其特点,满足不同信息需求。

  • 搜索结果的精细化控制 (各种来源下的参数)

    • 设计目的:

      即使指定了来源,有时也需要过滤或聚焦。比如网页搜索,可能想排除某些网站;搜 X,可能只关心特定大 V 的发言;新闻可能只想看某个国家的。

    • "excluded_websites" (排除网站):

      就像给搜索引擎加个黑名单,告诉模型"查网页或新闻时,别看这些网站"。用户可以用它来排除质量不高或不相关的网站,提高搜索结果的可用性。

    • "x_handles" (指定 X 句柄):

      这个专门给搜 X 用。只看列表中指定用户的帖子。这对于跟踪特定的人物、组织或官方账号的最新动态非常有用。

    • "country" (指定国家):

      查网页或新闻时,可以限定只看某个国家/地区的信息。这对于有地域限制或关注特定国家动态的查询非常重要。

    • "safe_search" (安全搜索):

      这个是出于内容过滤和合规考虑。默认是开启的,可以控制是否过滤掉不适宜的内容。默认开启是为了大多数用户和场景的安全。

    • "links" (指定 RSS Feed):

      直接告诉模型去读某个特定的 RSS Feed。这适用于用户有自己的特定信息源,希望模型直接利用其内容的情况。

  • 结果引用的返回 ("return_citations")

    • 设计目的:

      模型生成的回复是基于搜索到的实时数据。用户可能想知道这些信息是从哪里来的,以便核实或深入了解。

    • 设计方式:

      设置为 true 后,模型在回复时会附带引用来源的链接。

    • 串流时的处理:

      考虑到性能和用户体验,如果使用串流(Streaming),引用不是边生成边给,而是在最后一个数据块里一次性给出来。这是串流场景下的常见处理方式。

  • 搜索时间范围 ("from_date", "to_date")

    • 设计目的:

      很多实时信息是有时效性的。用户可能只想看某个时间段内的数据,比如"过去 24 小时"或"2022 年全年"。

    • 设计方式:

      允许用户设定开始日期和结束日期。而且这两个日期可以单独使用,很灵活。这让搜索结果的时间范围控制变得非常精确。

  • 搜索结果数量限制 ("max_search_results")

    • 设计目的:

      搜索可能会找到很多结果,但模型处理能力有限,而且太多信息反而可能干扰模型判断。需要控制输入给模型的搜索结果数量。

    • 设计方式:

      设定一个最大值,告诉模型最多考虑多少条搜索结果。

    • 默认值:

      默认是 20 条。这个数字可能是根据经验设定的一个平衡值,既能提供足够的信息,又不至于过载。

    https://docs.x.ai/docs/guides/live-search

相关推荐
熬夜苦读学习5 分钟前
线程封装与互斥
linux·运维·服务器·开发语言·c++
若水晴空初如梦7 分钟前
QT聊天项目DAY12
运维·服务器
龙泉寺天下行走7 分钟前
《进化陷阱》--AI 生成文章 《连载 1》
java·服务器·前端
半岛铁盒BKB11 分钟前
3par persona设置错误,linux I/O持续报错
linux·存储·3par
..过云雨34 分钟前
结课作业自选01. 内核空间 MPU6050 体感鼠标驱动程序(二)(完整实现流程)
linux·开发语言·嵌入式硬件
西阳未落38 分钟前
Linux(5)——再谈操作系统
linux·运维·服务器
万里不留行41 分钟前
SRS流媒体服务器,配置国标协议对接和HTTPS视频流输出功能
运维·服务器·https·音视频·实时音视频
珹洺1 小时前
计算机操作系统(十二)详细讲解调计算机操作系统调度算法与多处理机调度
android·java·数据库
fei_sun1 小时前
【Harmony OS】作业四 布局
java·linux·网络
HaanLen1 小时前
React19源码系列之渲染阶段performUnitOfWork
前端·javascript·react.js·react19源码