【王树森搜索引擎技术】概要01:搜索引擎的基本概念

1. 基本名词

  • query:查询词
  • SUG:搜索建议
  • 文档:搜索结果
  • 标签/筛选项
  • 文档单列曝光
  • 文档双列曝光

2. 曝光与点击

  • 曝光:用户在搜索结果页上看到文档,就算曝光
  • 文档点击:在曝光后,用户点击文档,进入文档的详细页
  • 文档点击率:文档点积总次数/文档曝光总次数
  • 查询词点击:用户点击搜索结果页上的任意一篇文档,就算查询词点击。无论点击了多少次,只要点击了,就算查询词点击
  • 查询词点击率(有点比):查询词点击总次数/搜索总次数
  • 查询词首屏点击:用户点击搜索结果页首屏的任意一篇文档,就算"查询词首屏点击"
  • 查询词首屏点击率(首屏有点比):查询词首屏点击总次数/搜索总次数
  • 首屏点击的定义更严格,所以查询词首屏点击率比查询词点击率更小
  • 它们很相似,都能反应用户能否很好地找到所需的文档
  • 文档点击率:10%左右,通常很小
  • 查询词点击率(有点比):70%左右
  • 查询词首屏点击率(首屏有点比):60%左右
  • 有点比的重要性高于文档点击率

3. 垂搜 vs 通搜

  • 垂直搜索(垂搜):针对某一个行业的搜索引擎。比如电商搜索,学术搜素,本地生活搜索等
  • 垂直搜索的文档普遍是结构化的,容易根据文档属性标签做搜索筛选。比如电商可以限定卖家和价格,学术可以限定作者,期刊,年份等
  • 垂直搜索用户的意图明确
  • 通用搜索(通搜):覆盖面广,不限于一个领域。例如百度,必应,抖音。
  • 文档来源广,覆盖面大。例如网页,视频,商品等
  • 没有结构化,检索难度大
  • 用户使用通搜的目的各不相同,较难判断用户意图
  • 课程主要研究通用搜索
相关推荐
LaughingZhu1 天前
Product Hunt 每日热榜 | 2025-11-14
人工智能·经验分享·搜索引擎·产品运营
liliangcsdn1 天前
如何基于DSL脚本进行elasticsearch向量检索示例
大数据·elasticsearch·搜索引擎
厨 神1 天前
11月10日ES本机
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客3 天前
Elasticsearch 的结构化文档配置 - 递归分块实践
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jenkins
weisian1513 天前
Elasticsearch-4--倒排索引的原理?
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客4 天前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php
Elastic 中国社区官方博客5 天前
Elasticsearch:如何为 Elastic Stack 部署 E5 模型 - 下载及隔离环境
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elastic 中国社区官方博客5 天前
Elasticsearch:相关性在 AI 代理上下文工程中的影响
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Albert Edison5 天前
【项目设计】基于正倒排索引的Boost搜索引擎
linux·网络·c++·后端·http·搜索引擎
极客学术工坊6 天前
2023年第十五届 “电工杯” 大学生数学建模竞赛-B题 人工智能对大学生学习影响的评价-人工智能对大学生学习影响的评价
搜索引擎