Live Search API :给大模型装了一个“实时搜索引擎”的插件

6月5号前免费使用。

Live Search 是一项xAI API功能,允许 LLM 在生成响应时查询和考虑实时数据。通过此功能,您可以直接从 API 获得包含实时数据的聊天响应,而无需自己协调网络搜索和大型语言模型(LLM)工具调用。

可以把 Live Search 理解成给大模型装了一个"实时搜索引擎"的插件。但是,这个插件不能无脑地、一刀切地用,得有一些开关和调节器,这就是参数的作用。

以下是关键参数的设计思路:

  1. 总开关和使用模式 (search_parameters 字段里的 "mode")
  • 设计目的:

    不是所有对话都需要实时信息。有时只需要模型本身的知识,有时则必须用最新数据。所以得有个总开关,并且提供不同的使用模式。

  • "off" (关闭):

    就像说"这次聊天你别上网查了,就用你知道的回答就行"。这样可以确保回复的稳定性,也可能更快,适合不需要实时性的场景。

  • "on" (开启):

    相当于强行要求模型"去,给我查最新消息!"。适用于用户明确知道自己需要最新信息的情况,比如问"今天头条新闻是啥?"

  • "auto" (自动,也是默认设置):

    这个模式最"懒人友好"。就像告诉模型:"你看看用户问的问题,要是觉得上网查查能回答得更好、更准,你就去查;要是光凭你自己的知识库就够了,那就算了。" 这是默认设置,说明产品经理认为大多数情况下让模型自己判断是最方便、最合理的。

  • 为什么放在 search_parameters 字段里?

    把所有搜索相关的设置打包放在一个地方,让 API 请求结构更清晰,也方便管理。

  • 数据源选择 ("sources")

    • 设计目的:

      实时信息有很多来源:普通网页、社交媒体 (X)、新闻网站、甚至特定的 RSS Feed。用户可能只关心特定来源的信息。

    • 设计方式:

      允许用户指定一个列表,告诉模型"你搜索的时候,只考虑从这些地方找信息"。

    • 默认设置:

      如果用户不指定,默认会去"网页"和"X"上找。这是因为网页和 X 通常包含最广泛、最实时的信息类型,覆盖面广。

    • 支持的来源类型:

      提供了 "web" (普通网页)、"x" (X 帖子)、"news" (新闻源)、"rss" (RSS Feed)。每种来源都有其特点,满足不同信息需求。

  • 搜索结果的精细化控制 (各种来源下的参数)

    • 设计目的:

      即使指定了来源,有时也需要过滤或聚焦。比如网页搜索,可能想排除某些网站;搜 X,可能只关心特定大 V 的发言;新闻可能只想看某个国家的。

    • "excluded_websites" (排除网站):

      就像给搜索引擎加个黑名单,告诉模型"查网页或新闻时,别看这些网站"。用户可以用它来排除质量不高或不相关的网站,提高搜索结果的可用性。

    • "x_handles" (指定 X 句柄):

      这个专门给搜 X 用。只看列表中指定用户的帖子。这对于跟踪特定的人物、组织或官方账号的最新动态非常有用。

    • "country" (指定国家):

      查网页或新闻时,可以限定只看某个国家/地区的信息。这对于有地域限制或关注特定国家动态的查询非常重要。

    • "safe_search" (安全搜索):

      这个是出于内容过滤和合规考虑。默认是开启的,可以控制是否过滤掉不适宜的内容。默认开启是为了大多数用户和场景的安全。

    • "links" (指定 RSS Feed):

      直接告诉模型去读某个特定的 RSS Feed。这适用于用户有自己的特定信息源,希望模型直接利用其内容的情况。

  • 结果引用的返回 ("return_citations")

    • 设计目的:

      模型生成的回复是基于搜索到的实时数据。用户可能想知道这些信息是从哪里来的,以便核实或深入了解。

    • 设计方式:

      设置为 true 后,模型在回复时会附带引用来源的链接。

    • 串流时的处理:

      考虑到性能和用户体验,如果使用串流(Streaming),引用不是边生成边给,而是在最后一个数据块里一次性给出来。这是串流场景下的常见处理方式。

  • 搜索时间范围 ("from_date", "to_date")

    • 设计目的:

      很多实时信息是有时效性的。用户可能只想看某个时间段内的数据,比如"过去 24 小时"或"2022 年全年"。

    • 设计方式:

      允许用户设定开始日期和结束日期。而且这两个日期可以单独使用,很灵活。这让搜索结果的时间范围控制变得非常精确。

  • 搜索结果数量限制 ("max_search_results")

    • 设计目的:

      搜索可能会找到很多结果,但模型处理能力有限,而且太多信息反而可能干扰模型判断。需要控制输入给模型的搜索结果数量。

    • 设计方式:

      设定一个最大值,告诉模型最多考虑多少条搜索结果。

    • 默认值:

      默认是 20 条。这个数字可能是根据经验设定的一个平衡值,既能提供足够的信息,又不至于过载。

    https://docs.x.ai/docs/guides/live-search

相关推荐
小叶lr4 分钟前
jenkins打包前端样式丢失/与本地不一致问题
运维·前端·jenkins
浩星10 分钟前
electron系列1:Electron不是玩具,为什么桌面应用需要它?
前端·javascript·electron
zxrhhm15 分钟前
SQLServer限制特定数据库的CPU使用率,确保关键业务系统有足够的资源
数据库·sqlserver
亚空间仓鼠21 分钟前
OpenEuler系统常用服务(五)
linux·运维·服务器·网络
ZC跨境爬虫28 分钟前
Scrapy工作空间搭建与目录结构解析:从初始化到基础配置全流程
前端·爬虫·python·scrapy·自动化
小村儿31 分钟前
连载04-最重要的Skill---一起吃透 Claude Code,告别 AI coding 迷茫
前端·后端·ai编程
刘~浪地球38 分钟前
Redis 从入门到精通(十三):哨兵与集群
数据库·redis·缓存
_院长大人_1 小时前
Vue + ECharts 实现价格趋势分析图
前端·vue.js·echarts
dyyshb1 小时前
PostgreSQL 终极兜底方案
数据库·postgresql
AI成长日志1 小时前
【AI原生开发实战】1.2 传统开发 vs AI原生开发:思维转变与架构差异
服务器·架构·ai-native