在前前公司,有一个哥们,解决问题的速度贼快,他总能快速的在浏览器中搜索到他想要的答案。虽然我们遇到的相同的问题,但是搜索出来的答案,却总是千差万别,甚至尝试各种描述都得不到他搜索的结果,当时真是百思不得其解。
对于搜索不到他那样的答案,到底是哪个环节出现了问题?直到若干年后,我才有了一些答案。
本篇文章核心,是如何更好的利用搜索技巧,快速的检索答案。没有前戏,直接上干货。
一、尝试用英文描述你的问题
最近在研究如何写出更好的 Prompt,于是发送问题进行搜索。
中文词描述搜索
还不错,不过有一些是翻译文章,比较生硬;于是我用英文进行搜索
英文词描述搜索
搜索到了一篇 OpenAPI 官方写的 【Prompt engineering】 文章,内容不错,符合我的预期。
所以当你觉得中文描述搜索的结果不能满足诉求的时候,不妨用英文描述后再进行搜索,利用中文和英文,实现互补。
二、"简化"你的描述
场景一: 对问题描述十分详细,结果搜索出来的答案牛头不对马嘴,让你非常失望;你反复地变化着描述,结果还是一样,你倒腾了一下午,精疲力尽,结果还是没有通过浏览器得到想要的答案,十分沮丧。
场景二: 那个晚上,程序出了一个罕见的bug,你把报错信息复制到浏览器进行搜索,搜索出来的文章都是零零散散的出现一些关键字,你挨个翻了所有文章,结果都没有得到你的答案,当你看到手机的时候,已经显示十一点了。那个晚上你睡得一点也踏实,心里还在牵挂着那个问题。
出现这样的搜索问题,有可能是你还不了解搜索引擎。
搜索引擎是通过分词与文件建立索引,你对问题描述得越丰富,文字越多,搜索引擎就会拆分出更多的词组,就会按照这些词组关联更多的文章。如果无关信息越多,那么关键字的权重就越低,搜索的结果就可能越差
比如你的目的是【搜索技巧】,那么【哪些】是没有用的,所以【哪些】 搜索出来的信息就是无效的。
"废话版"
"如何优化 mysql 的索引,有哪些技巧",
搜索引擎是通过分词进行搜索的,标记红的部分就是关键词。
"如何"、"有哪些" 其实就是彻底的废话!
简化版
去掉无关信息,仅仅保留必要信息。(不要担心这些词语是否通顺,想一下搜索引擎的原理是什么)
搜索出来的文章和第一种看起来差不多。但就像刚刚分析的那样,描述得越多,无关的信息就越多,就会稀释关键信息的浓度。
通过如下对比,可能增加你的体感。
第一种提问,多翻几页后,无关信息增多。
第二种问题,即使在最后一页,搜索出来的信息依然有关联度。
拒绝"废话",抓住核心关键词,少即是多。 千万不要极富感情地输入一大串文字描述,它得不到你想要的答案,它是没有感情的机器。
请摒弃和浏览器正常沟通的思维,给几个关键字,养成这种习惯,会受益匪浅。
三、精准搜索用引号
因为搜索引擎会进行分词,当我们想搜索一个完整句子的时候,可能会得不到想要的结果,或者搜索出来太多无关的数据。不妨试试将关键词、字等用引号包起来。
比如我想搜索"invalid state transition" 相关的文章,由于搜索引擎会分词,结果会出现"invalid"、"transition" 。
不加引号
添加引号
缩小范围,精准内容
减少分词带来的影响,过滤一些无效的检索数据。
四、搜索图片再链接到文章
有时候我们想搜索一篇技术文章,但是搜索出来的内容参差不齐,这个时候不妨通过先搜索图片,查看哪些图片符合你的需求,再通过图片链接到文章。
举例子:我想搜索 URL 的组成。
正常搜索
能够得到一些文章,点击进去查看,不够完美或者没有达到我的诉求。
搜索图片
一些 "URL"的图画得不错,点击进去查看内容,确实也还可以。
秉着图片画得不错,文章应该也应该不错的理论。可以试试这个思路,我用过多次还可以。
比如:分布式、rokectmq消息一致性等技术问题,都可以按照这个策略
五、搜索引擎提供的高级工具
时间约束
比如我想搜索关于 LLM 近 1 年 RAG 资料。(可以通过工具,筛选条件)
在工具中还有其他一些非常好用的工具
缩小搜索范围的条件限制,例如:
- 搜索文件类型
- 网站过滤
- 地区过滤
- 语言过滤
- .......
搜索文件格式
比如我想搜索 LLM RAG 的 pdf 资料。
fileType:pdf
通过工具添加筛选条件就能生成对应语法
像搜索一些相关的论文,pdf 资料,这种方式更高效,目的性也更强。
搜索视频、图书
除了我们经常使用的网页和图片,其实也可以搜索视频、图书、甚至新闻。
比如搜索 LLM RAG 相关的视频。
对于想学习新的技术、知识,视频会更加直观。
六、特殊符号
+ (关键词同时出现)
比如搜索 LLM + RAG + 应用
三个关键字
内容比较完整,具备三个关键字。
- (排除)
搜索分布式数据库,但是需要排除 OceanBase
* (模糊匹配)
有时候忘记了关键字,就用 * 进行匹配。比如想搜索 Elasticsearch 的应用实践。但是 Elasticsearch
忘记了。
当然还有其他一些特殊符号,比如 AND、 OR 等等, 就不再继续举例子了。
七、"授人以鱼,不如授人以渔"
如果你还想获得更多的使用技巧,用两招我上面说的方法。
- 英文版: improve search skill
- 搜索 + 技巧 (关键词)
输入"搜索 + 技巧"
或者 Improve search skill
通过高效的检索信息,可以加速我们解决问题的能力,通过这些技巧的实践,一定会提升我们工作的效率。
八、彩蛋
随着大模型能力的增加,似乎开始逐步替代搜索引擎的能力。
比如我想整一篇搜索技巧的文章,
显然,搜索的结果不错。
大模型至少有两点直观感受:
- 它能理解我们的语义,不像搜索引擎那样"不解风情"
- 它有概括能力,可以快速浓缩观点、概括总结。
当然大模型知识问答目前只能提供文字能力,不能像搜索引擎那样给出一些图文并茂的内容,
另外大模型能给的内容的专业性、精准性还有提升空间。
我们在工作和生活中,可以将两者结合起来,取长补短。从而更加便捷服务于我们,下面是kimi,左边做知识问答,右边给出网页搜索内容,确实是不错的方式。
通过这些有用的技巧总结分享,希望可以更好地帮助我们的工作和生活。
感谢阅读,本文到此结束。