Live Search API :给大模型装了一个“实时搜索引擎”的插件

6月5号前免费使用。

Live Search 是一项xAI API功能,允许 LLM 在生成响应时查询和考虑实时数据。通过此功能,您可以直接从 API 获得包含实时数据的聊天响应,而无需自己协调网络搜索和大型语言模型(LLM)工具调用。

可以把 Live Search 理解成给大模型装了一个"实时搜索引擎"的插件。但是,这个插件不能无脑地、一刀切地用,得有一些开关和调节器,这就是参数的作用。

以下是关键参数的设计思路:

  1. 总开关和使用模式 (search_parameters 字段里的 "mode")
  • 设计目的:

    不是所有对话都需要实时信息。有时只需要模型本身的知识,有时则必须用最新数据。所以得有个总开关,并且提供不同的使用模式。

  • "off" (关闭):

    就像说"这次聊天你别上网查了,就用你知道的回答就行"。这样可以确保回复的稳定性,也可能更快,适合不需要实时性的场景。

  • "on" (开启):

    相当于强行要求模型"去,给我查最新消息!"。适用于用户明确知道自己需要最新信息的情况,比如问"今天头条新闻是啥?"

  • "auto" (自动,也是默认设置):

    这个模式最"懒人友好"。就像告诉模型:"你看看用户问的问题,要是觉得上网查查能回答得更好、更准,你就去查;要是光凭你自己的知识库就够了,那就算了。" 这是默认设置,说明产品经理认为大多数情况下让模型自己判断是最方便、最合理的。

  • 为什么放在 search_parameters 字段里?

    把所有搜索相关的设置打包放在一个地方,让 API 请求结构更清晰,也方便管理。

  • 数据源选择 ("sources")

    • 设计目的:

      实时信息有很多来源:普通网页、社交媒体 (X)、新闻网站、甚至特定的 RSS Feed。用户可能只关心特定来源的信息。

    • 设计方式:

      允许用户指定一个列表,告诉模型"你搜索的时候,只考虑从这些地方找信息"。

    • 默认设置:

      如果用户不指定,默认会去"网页"和"X"上找。这是因为网页和 X 通常包含最广泛、最实时的信息类型,覆盖面广。

    • 支持的来源类型:

      提供了 "web" (普通网页)、"x" (X 帖子)、"news" (新闻源)、"rss" (RSS Feed)。每种来源都有其特点,满足不同信息需求。

  • 搜索结果的精细化控制 (各种来源下的参数)

    • 设计目的:

      即使指定了来源,有时也需要过滤或聚焦。比如网页搜索,可能想排除某些网站;搜 X,可能只关心特定大 V 的发言;新闻可能只想看某个国家的。

    • "excluded_websites" (排除网站):

      就像给搜索引擎加个黑名单,告诉模型"查网页或新闻时,别看这些网站"。用户可以用它来排除质量不高或不相关的网站,提高搜索结果的可用性。

    • "x_handles" (指定 X 句柄):

      这个专门给搜 X 用。只看列表中指定用户的帖子。这对于跟踪特定的人物、组织或官方账号的最新动态非常有用。

    • "country" (指定国家):

      查网页或新闻时,可以限定只看某个国家/地区的信息。这对于有地域限制或关注特定国家动态的查询非常重要。

    • "safe_search" (安全搜索):

      这个是出于内容过滤和合规考虑。默认是开启的,可以控制是否过滤掉不适宜的内容。默认开启是为了大多数用户和场景的安全。

    • "links" (指定 RSS Feed):

      直接告诉模型去读某个特定的 RSS Feed。这适用于用户有自己的特定信息源,希望模型直接利用其内容的情况。

  • 结果引用的返回 ("return_citations")

    • 设计目的:

      模型生成的回复是基于搜索到的实时数据。用户可能想知道这些信息是从哪里来的,以便核实或深入了解。

    • 设计方式:

      设置为 true 后,模型在回复时会附带引用来源的链接。

    • 串流时的处理:

      考虑到性能和用户体验,如果使用串流(Streaming),引用不是边生成边给,而是在最后一个数据块里一次性给出来。这是串流场景下的常见处理方式。

  • 搜索时间范围 ("from_date", "to_date")

    • 设计目的:

      很多实时信息是有时效性的。用户可能只想看某个时间段内的数据,比如"过去 24 小时"或"2022 年全年"。

    • 设计方式:

      允许用户设定开始日期和结束日期。而且这两个日期可以单独使用,很灵活。这让搜索结果的时间范围控制变得非常精确。

  • 搜索结果数量限制 ("max_search_results")

    • 设计目的:

      搜索可能会找到很多结果,但模型处理能力有限,而且太多信息反而可能干扰模型判断。需要控制输入给模型的搜索结果数量。

    • 设计方式:

      设定一个最大值,告诉模型最多考虑多少条搜索结果。

    • 默认值:

      默认是 20 条。这个数字可能是根据经验设定的一个平衡值,既能提供足够的信息,又不至于过载。

    https://docs.x.ai/docs/guides/live-search

相关推荐
摸鱼仙人~20 分钟前
styled-components:现代React样式解决方案
前端·react.js·前端框架
段帅龙呀24 分钟前
Redis构建缓存服务器
服务器·redis·缓存
乌鸦不像写字台1 小时前
【docker部署】在服务器上使用docker
服务器·docker·容器
sasaraku.1 小时前
serviceWorker缓存资源
前端
RadiumAg2 小时前
记一道有趣的面试题
前端·javascript
yangzhi_emo2 小时前
ES6笔记2
开发语言·前端·javascript
牧以南歌〆2 小时前
在Ubuntu主机中修改ARM Linux开发板的根文件系统
linux·arm开发·驱动开发·ubuntu
yanlele2 小时前
我用爬虫抓取了 25 年 5 月掘金热门面试文章
前端·javascript·面试
互联网搬砖老肖3 小时前
运维打铁: MongoDB 数据库集群搭建与管理
运维·数据库·mongodb
Antonio9153 小时前
【音视频】HLS简介与服务器搭建
运维·服务器·音视频