搜索引擎学习笔记-概要

一、基本概念

  • Query:查询词
  • SUG:查询建议
  • 搜索结果页:包含标签、筛选项
  • 曝光点击
    • 文档点击率:文档点击总次数/文档曝光总次数
    • 查询词点击率:有点比,点击搜索结果页任一文档,就算查询词点击。查询词点击总次数/搜索总次数
    • 查询词首屏点击率:首屏有点比,点击搜索结果页首屏任一文档,就算查询词首屏点击。查询词首屏 点击总次数/搜索总次数
  • 搜索类型
    • 垂搜:针对某一个行业的搜索引擎。文档普遍结构化,容易根据文档属性标签做检索筛选;用户意图明确。
    • 通搜:不限于一个领域。文档来源广,覆盖面大;没有结构化,检索难度大;用户意图不容易判断
  • 技术模块:相关性、查询词处理、查询词推荐、召回、排序

二、用户满意度

影响因素:相关性、内容质量、时效性、个性化是用户满意度的重要因素

如何评估:留存、有点比等客观指标;人工评价的主观指标

相关性

内容质量

时效性

突发时效性不好用模型判断,只能用数据挖掘方式

个性化

三、评价指标

北极星指标

中间指标

文档点击率、有点比、首屏有点比、平均首点位置、主动换词率、交互指标

人工体验评估

四、链路

查询词处理

召回

排序

相关推荐
冬奇Lab19 小时前
Workflow 系列(02):设计范式——四层架构、三种 Context 传递模式与确认门设计
人工智能·agent·工作流引擎
冬奇Lab19 小时前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能·开源·资讯
有道AI情报局19 小时前
Harness即产品
人工智能·agent
罗西的思考20 小时前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
IT_陈寒21 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端·人工智能·后端
笃行35021 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户6856326208691 天前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能
你_好1 天前
# 给你的产品嵌入一个「会操作界面的 AI 助手」
人工智能
ShallWeL1 天前
【机器学习】(3)—— 线性回归:梯度下降
人工智能·机器学习
陈广亮1 天前
Prompt、Context、Harness、Agentic:LLM 应用四层嵌套结构,搞清自己卡在哪一层
人工智能