和 google 搜索引擎“交个朋友”

在前前公司,有一个哥们,解决问题的速度贼快,他总能快速的在浏览器中搜索到他想要的答案。虽然我们遇到的相同的问题,但是搜索出来的答案,却总是千差万别,甚至尝试各种描述都得不到他搜索的结果,当时真是百思不得其解。

对于搜索不到他那样的答案,到底是哪个环节出现了问题?直到若干年后,我才有了一些答案。

本篇文章核心,是如何更好的利用搜索技巧,快速的检索答案。没有前戏,直接上干货。

一、尝试用英文描述你的问题

最近在研究如何写出更好的 Prompt,于是发送问题进行搜索。

中文词描述搜索

还不错,不过有一些是翻译文章,比较生硬;于是我用英文进行搜索

英文词描述搜索

搜索到了一篇 OpenAPI 官方写的 【Prompt engineering】 文章,内容不错,符合我的预期。

所以当你觉得中文描述搜索的结果不能满足诉求的时候,不妨用英文描述后再进行搜索,利用中文和英文,实现互补。

二、"简化"你的描述

场景一: 对问题描述十分详细,结果搜索出来的答案牛头不对马嘴,让你非常失望;你反复地变化着描述,结果还是一样,你倒腾了一下午,精疲力尽,结果还是没有通过浏览器得到想要的答案,十分沮丧。

场景二: 那个晚上,程序出了一个罕见的bug,你把报错信息复制到浏览器进行搜索,搜索出来的文章都是零零散散的出现一些关键字,你挨个翻了所有文章,结果都没有得到你的答案,当你看到手机的时候,已经显示十一点了。那个晚上你睡得一点也踏实,心里还在牵挂着那个问题。

出现这样的搜索问题,有可能是你还不了解搜索引擎。

搜索引擎是通过分词与文件建立索引,你对问题描述得越丰富,文字越多,搜索引擎就会拆分出更多的词组,就会按照这些词组关联更多的文章。如果无关信息越多,那么关键字的权重就越低,搜索的结果就可能越差

比如你的目的是【搜索技巧】,那么【哪些】是没有用的,所以【哪些】 搜索出来的信息就是无效的。

"废话版"

"如何优化 mysql 的索引,有哪些技巧",

搜索引擎是通过分词进行搜索的,标记红的部分就是关键词。

"如何"、"有哪些" 其实就是彻底的废话!

简化版

去掉无关信息,仅仅保留必要信息。(不要担心这些词语是否通顺,想一下搜索引擎的原理是什么)

搜索出来的文章和第一种看起来差不多。但就像刚刚分析的那样,描述得越多,无关的信息就越多,就会稀释关键信息的浓度

通过如下对比,可能增加你的体感。

第一种提问,多翻几页后,无关信息增多。

第二种问题,即使在最后一页,搜索出来的信息依然有关联度。

拒绝"废话",抓住核心关键词,少即是多。 千万不要极富感情地输入一大串文字描述,它得不到你想要的答案,它是没有感情的机器。

请摒弃和浏览器正常沟通的思维,给几个关键字,养成这种习惯,会受益匪浅。

三、精准搜索用引号

因为搜索引擎会进行分词,当我们想搜索一个完整句子的时候,可能会得不到想要的结果,或者搜索出来太多无关的数据。不妨试试将关键词、字等用引号包起来。

比如我想搜索"invalid state transition" 相关的文章,由于搜索引擎会分词,结果会出现"invalid"、"transition" 。

不加引号

添加引号

缩小范围,精准内容

减少分词带来的影响,过滤一些无效的检索数据。

四、搜索图片再链接到文章

有时候我们想搜索一篇技术文章,但是搜索出来的内容参差不齐,这个时候不妨通过先搜索图片,查看哪些图片符合你的需求,再通过图片链接到文章。

举例子:我想搜索 URL 的组成。

正常搜索

能够得到一些文章,点击进去查看,不够完美或者没有达到我的诉求。

搜索图片

一些 "URL"的图画得不错,点击进去查看内容,确实也还可以。

秉着图片画得不错,文章应该也应该不错的理论。可以试试这个思路,我用过多次还可以。

比如:分布式、rokectmq消息一致性等技术问题,都可以按照这个策略

五、搜索引擎提供的高级工具

时间约束

比如我想搜索关于 LLM 近 1 年 RAG 资料。(可以通过工具,筛选条件)

在工具中还有其他一些非常好用的工具

缩小搜索范围的条件限制,例如:

  • 搜索文件类型
  • 网站过滤
  • 地区过滤
  • 语言过滤
  • .......

搜索文件格式

比如我想搜索 LLM RAG 的 pdf 资料。

fileType:pdf 通过工具添加筛选条件就能生成对应语法

像搜索一些相关的论文,pdf 资料,这种方式更高效,目的性也更强。

搜索视频、图书

除了我们经常使用的网页和图片,其实也可以搜索视频、图书、甚至新闻。

比如搜索 LLM RAG 相关的视频。

对于想学习新的技术、知识,视频会更加直观。

六、特殊符号

+ (关键词同时出现)

比如搜索 LLM + RAG + 应用 三个关键字

内容比较完整,具备三个关键字。

- (排除)

搜索分布式数据库,但是需要排除 OceanBase

* (模糊匹配)

有时候忘记了关键字,就用 * 进行匹配。比如想搜索 Elasticsearch 的应用实践。但是 Elasticsearch 忘记了。

当然还有其他一些特殊符号,比如 AND、 OR 等等, 就不再继续举例子了。

七、"授人以鱼,不如授人以渔"

如果你还想获得更多的使用技巧,用两招我上面说的方法。

  • 英文版: improve search skill
  • 搜索 + 技巧 (关键词)

输入"搜索 + 技巧"

或者 Improve search skill

通过高效的检索信息,可以加速我们解决问题的能力,通过这些技巧的实践,一定会提升我们工作的效率。

八、彩蛋

随着大模型能力的增加,似乎开始逐步替代搜索引擎的能力。

比如我想整一篇搜索技巧的文章,

显然,搜索的结果不错。

大模型至少有两点直观感受:

  • 它能理解我们的语义,不像搜索引擎那样"不解风情"
  • 它有概括能力,可以快速浓缩观点、概括总结。

当然大模型知识问答目前只能提供文字能力,不能像搜索引擎那样给出一些图文并茂的内容,

另外大模型能给的内容的专业性、精准性还有提升空间。

我们在工作和生活中,可以将两者结合起来,取长补短。从而更加便捷服务于我们,下面是kimi,左边做知识问答,右边给出网页搜索内容,确实是不错的方式。

通过这些有用的技巧总结分享,希望可以更好地帮助我们的工作和生活。

感谢阅读,本文到此结束。

相关推荐
WeeJot嵌入式41 分钟前
【C语言】标准IO
c语言·后端
hnmpf1 小时前
flask_sqlalchemy relationship 子表排序
后端·python·flask
Quantum&Coder1 小时前
Swift语言的数据库编程
开发语言·后端·golang
Q_27437851091 小时前
springboot高校电子图书馆的大数据平台规划与设计
大数据·spring boot·后端
aiee2 小时前
GO通过SMTP协议发送邮件
开发语言·后端·golang
JINGWHALE13 小时前
设计模式 行为型 备忘录模式(Memento Pattern)与 常见技术框架应用 解析
前端·人工智能·后端·设计模式·性能优化·系统架构·备忘录模式
大雄野比3 小时前
了解 ASP.NET Core 中的中间件
后端·中间件·asp.net
啊晚3 小时前
ASP.NET Core - IStartupFilter 与 IHostingStartup
后端·asp.net
Archy_Wang_13 小时前
ASP.NET Core 中,Cookie 认证在集群环境下的应用
后端·asp.net
AskHarries3 小时前
如何在 Google Cloud Shell 中使用 Visual Studio Code (VS Code)?
后端·google