
无论是搜索、推荐还是问答,把企业的数据资产变成可检索、可调用的智能服务,往往意味着一条漫长且高门槛的链路 ------ 数据清洗、Embedding 选型、索引构建、策略配置、效果调优......
每一个环节都离不开工程投入和算法经验。
Viking AI 搜索 CLI (下文统称 SearchCLI) 正式发布, 代表着上述的这些复杂繁琐环节,现在都可以让 Agent 替你完成了 。
通过 IaC (Infrastructure as Code)范式,CLI 将数据入库、效果评测、搜推问答策略调优等一系列复杂任务,整合为一组简洁命令,搭配内置的 Skills ,Agent 可以瞬间变成企业私域数据搜索、推荐、智能问答系统的工程专家和算法专家,而你只需要在对话框中发出指令即可。
简单来说:会说话,就 能 做搜索推荐 和智能问答 。

SearchCLI 有什么用?来看一个实际场景:
小 V 是一名独立设计师,过去一年用 Seedream 生成了上万条素材。但素材越多,找起来反而越难:标签没打全,文件名靠不住,每次想找一张 "暖色调、带木纹质感的背景图",都只能在缩略图里凭运气翻。
更别说搭一套搜索推荐系统 ------ 光是向量索引和 Embedding 选型,就够劝退了。
小 V 痛定思痛:到底有没有个好法子, 不用开发,我自己一个人 能把这海量素材真正管起来,做到"需要哪张,一秒找到"?
有的兄弟,有的。 SearchCLI,只需要几条简单的命令,就能把本地素材库变成一个支持多 模态 搜索和相似推荐的智能图库, 妈妈再也不用担心我一张张地人肉找素材了。




快速上手:一行命令开启智能搜索之旅
SearchCLI 的安装与配置极度精简,所有的繁琐操作都可以由 Agent 通过对话式交互自动完成。
1. 安装与初始化:极简授权
小 V 的第一步很简单:使用 Trae、OpenClaw、Claude Code、Codex 等 AI Agent,让它自动完成下载和配置。
复制以下提示词,发给 Agent :
"帮我下载这个 CLI:github.com/volcengine/...,并告知我是否运行成功。"
安装完成后,在火山引擎官网获取 AK/SK(鉴权凭据),按照 Agent 的指示在终端输入 AK/SK,Agent 即可自动完成授权配置,整个过程几乎不需要手动操作。


如何获取 AK/SK:
点击console.volcengine.com/common-buy/... Viking AI 搜索首月体验版,注册火山账号,获取 AK/SK 以体验产品功能,首月仅需9.9元🥰
2. 智能数据预处理和导入
授权完成后,小 V 的当务之急就是要先把自己的一堆凌乱的数据清洗、处理和导入到服务中。
按传统做法,这通常需要经历繁琐的工程链路:自己写脚本遍历文件夹、提取图片特征、再一条条调用 API 上传......对于没有编程基础的小 V 来说,这几乎是一道无法逾越的鸿沟。
但有了 SearchCLI,小 V 根本不需要去管复杂的上传接口,直接把本地的图片素材发给 Agent,就可以先坐等数据预处理自动完成。原本零散的素材信息,会被自动整理成结构化数据,产出可直接入库的 Schema 和数据文件。

等数据准备好之后,导入这一步也不用她再自己折腾。Agent 会顺手完成数据集上传和入库,让这些素材真正进入搜索系统。

想尝试下智能数据导入,可以在github.com/Chen-chen42...下载数据集,并使用小 V 的素材库~
因为 CLI 中内置了数据预检的指令,此时 Agent 会执行以下环节以确保数据质量:

数据质量确认没问题后,正式入库开始了。
面对 10,000 条正式数据的写入,CLI 预判了接口的并发限制。Agent 没有采用粗暴的单次全量上传,而是自动编写了切片脚本,将数据划分为 5 个批次(每批 2000 条),并加入了平滑的休眠等待:
小 V 看着进度条一条条跑完,直呼快哉,素材库终于不再只是一个杂乱的文件夹了!

3. 搜索、推荐、问答策略自动生成
素材导进去了,接下来就是最关键的问题:能不能搜到想要的东西?
3.1 配置搜索系统
CLI 内嵌了包含文本与图像的多模态检索配置,搜索能力即刻可用。小 V 试着搜了 "白雪皑皑的自然景观"------ 结果不再是靠关键词硬匹配,而是真正理解了她的意图。


3.2 个性化推荐与相似物品推荐
搜索能用了,但小 V 觉得还不够------每次找素材,都得自己想关键词去搜,她更想要的是:系统根据浏览习惯,主动推荐风格相近、主题相关的内容。
于是,小 V 开始尝试配置推荐策略(也是一句话的事)。CLI 敏锐地提示"缺少用户行为数据",手头上没有行为数据不要紧,她直接把自己的偏好告诉 Agent:"我喜欢暖色调、自然质感、极简风格的素材,对卡通和赛博朋克风格不感兴趣。"
Agent 根据她的描述,自动生成了一份符合她审美偏好的模拟行为数据集,并丝滑完成上传。

CLI 自动完成了事件类型映射,并成功创建了 "首页推荐" 和 "相关推荐" 两大场景。



3.3 配置问答助手
搜索和推荐都跑起来了,但小 V 还想更进一步:有时候有些需求一两个词讲不清楚, 能不能直接用自然语言提问?
当然可以!

小 V 试着输入了"帮我找一些色彩丰富的水彩画素材",系统自动完成了意图理解、搜索召回、结果重排和答案生成,并返回了按类别整理过的素材建议。

她的素材库不再只是"等人来搜",而开始"主动引导提问" 。

4. 数据验证:效果评测与自动化调优
搜索推荐都跑起来了,但小 V 心里还有个疑问:效果到底好不好?如果搜不准,又该怎么调?
借助 CLI ,她实现了一套完全自动化的测试与调优闭环:

4.1 批量跑搜索、推荐测试集
小 V 自己没有现成的评测集,但 CLI 提供了专门用于构造评测集的命令,Agent 调用命令主动构造了包含多种意图的 Query 评测集------"阳光落满的房间""极简风格木画架""带着猫的舒适沙发"等,调用 CLI 接口执行批量基准测试。

4.2 分析结果并提供策略优化建议
首次基准测试的输出显示,搜索场景的整体 Top-5 平均相关性得分只有 0.5244。
问题出在哪?Agent 分析后发现:文本权重配置偏低,导致包含明确物体特征的查询,召回了太多语义相近但实体不匹配的长尾数据。同时,推荐场景中新注册的无行为用户也获取不到推荐内容。

4.3 自动完成策略修改
明确了问题后,Agent 直接将优化建议转化为配置文件,通过 CLI 瞬时完成了线上策略的热更新------将语义检索、关键词检索的权重调至合适值,不需要填表单,不需要改代码,改完即生效。

4.4 对比优化前后效果
更新完成后,自动化评测脚本再次跑通测试集。结果很直观:调优后,包含具体物体的具象 Query 匹配精准度得到了明显改善,而抽象 Query 的效果也稳中有升。

至此,专属于小 V 的素材库就正式搭建起来了。
几天后,面对甲方"既有科技感又温暖"的抽象催图需求,她只需在对话框输入这句话,毫秒间,完美契合的图片和关联的灵感推荐就呈现在眼前。
从面对上万张杂乱素材束手无策,到拥有专属的搜索、推荐、问答一体化 智能图库,小 V 一行代码都没写。借助 Agent 与 SearchCLI 的配合,沉睡在硬盘里的数据被彻底激活。她终于告别了繁琐的"找图拉锯战",把全部的时间和精力,还给了真正的设计与创作。
省流版总结:CLI 核心价值
很多时候,问题不是没有数据,而是数据还没有真正被用起来。
Wake up the data you already have ****------ SearchCLI 的价值,就在于把已有数据从"放着" 变成 "用起来",让原本分散在文件、表格和业务系统里的内容,真正具备可搜索、可推荐、可对话的智能能力。
1. 数据入库:解放双手,不靠手搓
不同于传统的粗放式导入,CLI 提供了 vs item profile、plan 和 apply 三位一体的入库流程:

2. Search, Recommend & Chat: 三个愿望一次实现
通过 CLI,用户可以一键拉起具备搜推问一体化能力的 AI 应用:

3. AI 驱动的策略调优:让好结果自己跑出来
在传统的搜索优化中,解决一个"搜不到"或"搜不准"的问题往往需要算法专家数天的排查与参数微调。现在,这一过程被极大地自动化了:

不止于素材库:多行业全场景赋能
SearchCLI 强大的泛化能力与灵活的架构,让它能够跨越场景边界,深度赋能各行各业的业务增长:
- 电商平台:将海量商品库一键资产化。
- 社交/内容平台:让海量图文不再沉寂。
- 企业知识库:将跨部门的企业知识入库,打造出一个全天候在线、懂业务的内部专家 Agent。

立即体验
数字化转型的下半场,是资产激活的竞速。Viking 家族的 SearchCLI 已经为你搭好了通往智能化的"最后一百米"高速公路。
我们邀请所有致力于探索生成式 AI 应用边界的企业与开发者,加入 Viking 的生态。
和我们一起,Wake up the data you already have !
对 SearchCLI 还有哪些期待or建议?欢迎在评论区留言~
立即试用
本 AIGC 素材库应用已开源,github.com/Chen-chen42...,敬请体验~
GitHub CLI 安装包 github.com/volcengine/...