Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐

无论是搜索、推荐还是问答,把企业的数据资产变成可检索、可调用的智能服务,往往意味着一条漫长且高门槛的链路 ------ 数据清洗、Embedding 选型、索引构建、策略配置、效果调优......

每一个环节都离不开工程投入和算法经验。

Viking AI 搜索 CLI (下文统称 SearchCLI) 正式发布, 代表着上述的这些复杂繁琐环节,现在都可以让 Agent 替你完成了

通过 IaC (Infrastructure as Code)范式,CLI 将数据入库、效果评测、搜推问答策略调优等一系列复杂任务,整合为一组简洁命令,搭配内置的 Skills ,Agent 可以瞬间变成企业私域数据搜索、推荐、智能问答系统的工程专家和算法专家,而你只需要在对话框中发出指令即可。

简单来说:会说话,就 做搜索推荐 和智能问答

SearchCLI 有什么用?来看一个实际场景:

小 V 是一名独立设计师,过去一年用 Seedream 生成了上万条素材。但素材越多,找起来反而越难:标签没打全,文件名靠不住,每次想找一张 "暖色调、带木纹质感的背景图",都只能在缩略图里凭运气翻。

更别说搭一套搜索推荐系统 ------ 光是向量索引和 Embedding 选型,就够劝退了。

小 V 痛定思痛:到底有没有个好法子, 不用开发,我自己一个人 能把这海量素材真正管起来,做到"需要哪张,一秒找到"?

有的兄弟,有的。 SearchCLI,只需要几条简单的命令,就能把本地素材库变成一个支持多 模态 搜索和相似推荐的智能图库, 妈妈再也不用担心我一张张地人肉找素材了。


快速上手:一行命令开启智能搜索之旅

SearchCLI 的安装与配置极度精简,所有的繁琐操作都可以由 Agent 通过对话式交互自动完成。

1. 安装与初始化:极简授权

小 V 的第一步很简单:使用 Trae、OpenClaw、Claude Code、Codex 等 AI Agent,让它自动完成下载和配置。

复制以下提示词,发给 Agent :

"帮我下载这个 CLI:github.com/volcengine/...,并告知我是否运行成功。"

安装完成后,在火山引擎官网获取 AK/SK(鉴权凭据),按照 Agent 的指示在终端输入 AK/SK,Agent 即可自动完成授权配置,整个过程几乎不需要手动操作。

如何获取 AK/SK:

点击console.volcengine.com/common-buy/... Viking AI 搜索首月体验版,注册火山账号,获取 AK/SK 以体验产品功能,首月仅需9.9元🥰

2. 智能数据预处理和导入

授权完成后,小 V 的当务之急就是要先把自己的一堆凌乱的数据清洗、处理和导入到服务中。

按传统做法,这通常需要经历繁琐的工程链路:自己写脚本遍历文件夹、提取图片特征、再一条条调用 API 上传......对于没有编程基础的小 V 来说,这几乎是一道无法逾越的鸿沟。

但有了 SearchCLI,小 V 根本不需要去管复杂的上传接口,直接把本地的图片素材发给 Agent,就可以先坐等数据预处理自动完成。原本零散的素材信息,会被自动整理成结构化数据,产出可直接入库的 Schema 和数据文件。

等数据准备好之后,导入这一步也不用她再自己折腾。Agent 会顺手完成数据集上传和入库,让这些素材真正进入搜索系统。

想尝试下智能数据导入,可以在github.com/Chen-chen42...下载数据集,并使用小 V 的素材库~

因为 CLI 中内置了数据预检的指令,此时 Agent 会执行以下环节以确保数据质量:

数据质量确认没问题后,正式入库开始了。

面对 10,000 条正式数据的写入,CLI 预判了接口的并发限制。Agent 没有采用粗暴的单次全量上传,而是自动编写了切片脚本,将数据划分为 5 个批次(每批 2000 条),并加入了平滑的休眠等待:

小 V 看着进度条一条条跑完,直呼快哉,素材库终于不再只是一个杂乱的文件夹了!

3. 搜索、推荐、问答策略自动生成

素材导进去了,接下来就是最关键的问题:能不能搜到想要的东西?

3.1 配置搜索系统

CLI 内嵌了包含文本与图像的多模态检索配置,搜索能力即刻可用。小 V 试着搜了 "白雪皑皑的自然景观"------ 结果不再是靠关键词硬匹配,而是真正理解了她的意图。

3.2 个性化推荐与相似物品推荐

搜索能用了,但小 V 觉得还不够------每次找素材,都得自己想关键词去搜,她更想要的是:系统根据浏览习惯,主动推荐风格相近、主题相关的内容。

于是,小 V 开始尝试配置推荐策略(也是一句话的事)。CLI 敏锐地提示"缺少用户行为数据",手头上没有行为数据不要紧,她直接把自己的偏好告诉 Agent:"我喜欢暖色调、自然质感、极简风格的素材,对卡通和赛博朋克风格不感兴趣。"

Agent 根据她的描述,自动生成了一份符合她审美偏好的模拟行为数据集,并丝滑完成上传。

CLI 自动完成了事件类型映射,并成功创建了 "首页推荐" 和 "相关推荐" 两大场景。

3.3 配置问答助手

搜索和推荐都跑起来了,但小 V 还想更进一步:有时候有些需求一两个词讲不清楚, 能不能直接用自然语言提问?

当然可以!

小 V 试着输入了"帮我找一些色彩丰富的水彩画素材",系统自动完成了意图理解、搜索召回、结果重排和答案生成,并返回了按类别整理过的素材建议。

她的素材库不再只是"等人来搜",而开始"主动引导提问"

4. 数据验证:效果评测与自动化调优

搜索推荐都跑起来了,但小 V 心里还有个疑问:效果到底好不好?如果搜不准,又该怎么调?

借助 CLI ,她实现了一套完全自动化的测试与调优闭环

4.1 批量跑搜索、推荐测试集

小 V 自己没有现成的评测集,但 CLI 提供了专门用于构造评测集的命令,Agent 调用命令主动构造了包含多种意图的 Query 评测集------"阳光落满的房间""极简风格木画架""带着猫的舒适沙发"等,调用 CLI 接口执行批量基准测试。

4.2 分析结果并提供策略优化建议

首次基准测试的输出显示,搜索场景的整体 Top-5 平均相关性得分只有 0.5244。

问题出在哪?Agent 分析后发现:文本权重配置偏低,导致包含明确物体特征的查询,召回了太多语义相近但实体不匹配的长尾数据。同时,推荐场景中新注册的无行为用户也获取不到推荐内容。

4.3 自动完成策略修改

明确了问题后,Agent 直接将优化建议转化为配置文件,通过 CLI 瞬时完成了线上策略的热更新------将语义检索、关键词检索的权重调至合适值,不需要填表单,不需要改代码,改完即生效。

4.4 对比优化前后效果

更新完成后,自动化评测脚本再次跑通测试集。结果很直观:调优后,包含具体物体的具象 Query 匹配精准度得到了明显改善,而抽象 Query 的效果也稳中有升。

至此,专属于小 V 的素材库就正式搭建起来了。

几天后,面对甲方"既有科技感又温暖"的抽象催图需求,她只需在对话框输入这句话,毫秒间,完美契合的图片和关联的灵感推荐就呈现在眼前。

从面对上万张杂乱素材束手无策,到拥有专属的搜索、推荐、问答一体化 智能图库,小 V 一行代码都没写。借助 Agent 与 SearchCLI 的配合,沉睡在硬盘里的数据被彻底激活。她终于告别了繁琐的"找图拉锯战",把全部的时间和精力,还给了真正的设计与创作。

省流版总结:CLI 核心价值

很多时候,问题不是没有数据,而是数据还没有真正被用起来。

Wake up the data you already have ****------ SearchCLI 的价值,就在于把已有数据从"放着" 变成 "用起来",让原本分散在文件、表格和业务系统里的内容,真正具备可搜索、可推荐、可对话的智能能力。

1. 数据入库:解放双手,不靠手搓

不同于传统的粗放式导入,CLI 提供了 vs item profileplanapply 三位一体的入库流程:

2. Search, Recommend & Chat: 三个愿望一次实现

通过 CLI,用户可以一键拉起具备搜推问一体化能力的 AI 应用:

3. AI 驱动的策略调优:让好结果自己跑出来

在传统的搜索优化中,解决一个"搜不到"或"搜不准"的问题往往需要算法专家数天的排查与参数微调。现在,这一过程被极大地自动化了:

不止于素材库:多行业全场景赋能

SearchCLI 强大的泛化能力与灵活的架构,让它能够跨越场景边界,深度赋能各行各业的业务增长:

  • 电商平台:将海量商品库一键资产化。
  • 社交/内容平台:让海量图文不再沉寂。
  • 企业知识库:将跨部门的企业知识入库,打造出一个全天候在线、懂业务的内部专家 Agent。

立即体验

数字化转型的下半场,是资产激活的竞速。Viking 家族的 SearchCLI 已经为你搭好了通往智能化的"最后一百米"高速公路。

我们邀请所有致力于探索生成式 AI 应用边界的企业与开发者,加入 Viking 的生态。

和我们一起,Wake up the data you already have !

对 SearchCLI 还有哪些期待or建议?欢迎在评论区留言~

立即试用

本 AIGC 素材库应用已开源,github.com/Chen-chen42...,敬请体验~

GitHub CLI 安装包 github.com/volcengine/...

相关推荐
深兰科技1 小时前
韩国KAIST AI半导体高管项目代表团到访深兰科技,聚焦AI算力与智能产业合作机会
人工智能·机器人·symfony·ai算力·深兰科技·韩国科学技术院·kaist
快乐on9仔1 小时前
NLP学习(一)transformers之pipeline体验
人工智能·深度学习
冬奇Lab1 小时前
Agent系列(六):记忆管理——让 Agent 记住重要的事
人工智能·agent
冬奇Lab1 小时前
一天一个开源项目(第113篇):notebooklm-py - 把 Google NotebookLM 变成可编程 API,还能接入 Claude Code
人工智能·google·开源
字节跳动开源1 小时前
veRL 推出开源 Uni-Agent:为通用 Agent 训练打造统一框架
开源
阿杰技术2 小时前
AI 编程助手落地实战:从提效到重构的全场景指南
人工智能·重构
Agent手记2 小时前
制造业生产流程自动化,Agent需要具备哪些能力?深度拆解2026工业级智能体落地范式与核心架构
大数据·人工智能·ai·架构·自动化
道里2 小时前
花了 5 万刀用 AI 写代码之后,这是我的全部经验
前端·人工智能