搜索引擎学习笔记-概要

一、基本概念

  • Query:查询词
  • SUG:查询建议
  • 搜索结果页:包含标签、筛选项
  • 曝光点击
    • 文档点击率:文档点击总次数/文档曝光总次数
    • 查询词点击率:有点比,点击搜索结果页任一文档,就算查询词点击。查询词点击总次数/搜索总次数
    • 查询词首屏点击率:首屏有点比,点击搜索结果页首屏任一文档,就算查询词首屏点击。查询词首屏 点击总次数/搜索总次数
  • 搜索类型
    • 垂搜:针对某一个行业的搜索引擎。文档普遍结构化,容易根据文档属性标签做检索筛选;用户意图明确。
    • 通搜:不限于一个领域。文档来源广,覆盖面大;没有结构化,检索难度大;用户意图不容易判断
  • 技术模块:相关性、查询词处理、查询词推荐、召回、排序

二、用户满意度

影响因素:相关性、内容质量、时效性、个性化是用户满意度的重要因素

如何评估:留存、有点比等客观指标;人工评价的主观指标

相关性

内容质量

时效性

突发时效性不好用模型判断,只能用数据挖掘方式

个性化

三、评价指标

北极星指标

中间指标

文档点击率、有点比、首屏有点比、平均首点位置、主动换词率、交互指标

人工体验评估

四、链路

查询词处理

召回

排序

相关推荐
Elastic 中国社区官方博客32 分钟前
Prometheus Remote Write 在 Elasticsearch 中的摄取原理
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索·prometheus
碳基硅坊35 分钟前
Mac Studio M3 Ultra 运行大模型实测:Qwen3.6 vs 6款主流模型工具调用对比
人工智能·qwen·qwen3.6
TeDi TIVE7 小时前
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
人工智能·spring·开源
MY_TEUCK7 小时前
Sealos 平台部署实战指南:结合 Cursor 与版本发布流程
java·人工智能·学习·aigc
三毛的二哥7 小时前
BEV:典型BEV算法总结
人工智能·算法·计算机视觉·3d
j_xxx404_7 小时前
大语言模型 (LLM) 零基础入门:核心原理、训练机制与能力全解
人工智能·ai·transformer
飞哥数智坊7 小时前
全新 SOLO 在日常办公中的实际体验
人工智能·solo
<-->8 小时前
Megatron(全称 Megatron-LM,由 NVIDIA 开发)和 DeepSpeed(由 Microsoft 开发)
人工智能·pytorch·python·深度学习·transformer
朝新_8 小时前
【Spring AI 】图像与语音模型实战
java·人工智能·spring
Yuanxl9038 小时前
神经网络-Sequential 应用与实战
人工智能·深度学习·神经网络