搜索引擎学习笔记-概要

一、基本概念

  • Query:查询词
  • SUG:查询建议
  • 搜索结果页:包含标签、筛选项
  • 曝光点击
    • 文档点击率:文档点击总次数/文档曝光总次数
    • 查询词点击率:有点比,点击搜索结果页任一文档,就算查询词点击。查询词点击总次数/搜索总次数
    • 查询词首屏点击率:首屏有点比,点击搜索结果页首屏任一文档,就算查询词首屏点击。查询词首屏 点击总次数/搜索总次数
  • 搜索类型
    • 垂搜:针对某一个行业的搜索引擎。文档普遍结构化,容易根据文档属性标签做检索筛选;用户意图明确。
    • 通搜:不限于一个领域。文档来源广,覆盖面大;没有结构化,检索难度大;用户意图不容易判断
  • 技术模块:相关性、查询词处理、查询词推荐、召回、排序

二、用户满意度

影响因素:相关性、内容质量、时效性、个性化是用户满意度的重要因素

如何评估:留存、有点比等客观指标;人工评价的主观指标

相关性

内容质量

时效性

突发时效性不好用模型判断,只能用数据挖掘方式

个性化

三、评价指标

北极星指标

中间指标

文档点击率、有点比、首屏有点比、平均首点位置、主动换词率、交互指标

人工体验评估

四、链路

查询词处理

召回

排序

相关推荐
冬奇Lab5 分钟前
Agent 系列(一):Agent 是什么——不只是「会调工具的 LLM」
人工智能·llm·agent
冬奇Lab12 分钟前
RAG 系列(二十四):代码 RAG——让 AI 理解你的代码库
人工智能·llm
南屹川20 分钟前
【算法】动态规划实战:从入门到精通
人工智能
人工智能培训24 分钟前
大模型与传统小模型、传统NLP模型的核心差异解析
人工智能·深度学习·神经网络·机器学习·生成对抗网络
沪漂阿龙28 分钟前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构
薛定猫AI1 小时前
【深度解析】Gemini Omni 多模态生成与 Agent 化创作工作流:从视频编辑到 UI 生成的技术演进
人工智能·ui·音视频
羊羊小栈1 小时前
AI赋能电力巡检:智能故障预警系统
人工智能·yolo·目标检测·毕业设计·大作业
Python私教1 小时前
视觉 Agent 爬取 vs Playwright 脚本:Browser Use 2026 选型表
人工智能
Python私教1 小时前
Crawlee StagehandCrawler:自然语言点 Load More 的工程化爬虫
人工智能
南屹川1 小时前
【容器化】Docker实战:从入门到生产环境部署
人工智能