后端学习笔记day5-搜索引擎相关

1.数据结构

关键词:数组、链表、哈希表、布隆过滤器和位图

数组和链表都是线性表,链表最简单的形式是单链表,对于检索过程加速,为了避免O(n)的检索时间,可以通过有序的组织数据把检索时间变成O(log n),这有赖于数组支持快速访问中间点。

链表如果也支持随机访问中间节点就也可以做到二分查找,以此出现的就是二叉搜索树,二叉搜索树需要平衡问题否则会退化成单链表。

哈希表是在数组和链表的检索上的进一步优化,能支持O(1)的访问,重点就是散列函数把id映射到位置,只要在查询时进行相同的计算就好了。

哈希表使用开放链表法解决冲突可以看成数组和链表的结合。

位图在哈希的基础上减少了空间的利用,只用1bit标记某个元素是否存在于系统中,布隆过滤器是在位图的基础上缩短数组长度通过多个哈希函数来实现。

2.搜索引擎用户满意度指标

包括相关性、时效性、文本质量、个性化。

相关性是一个客观指标只要文档d和查询q有一定关联就算。

时效性是根据不同的查询内容有不同的级别。

个性化对于用户的非常粗的查询有意义,因为精细化的查询可以直接锁定到用户希望得到的结果。

EAT是专家、权威、信赖的结合,比如权威机构大学发布的招生信息就比第三方辅导机构发布的招聘信息更加权威。

总结,搜索引擎和推荐的技术感觉相关性很高。

相关推荐
星河耀银海4 天前
大模型和搜索引擎到底有什么不一样
人工智能·搜索引擎
让学习成为一种生活方式4 天前
samblaster v.0.1.26安装与使用--生信工具096
大数据·elasticsearch·搜索引擎
西敏寺的乐章4 天前
排序三阶段:粗排→精排→重排,把业务信号灌进 ES 排序管道
elasticsearch·搜索引擎
小马爱打代码4 天前
Elasticsearch 集群容器化部署:构建 PB 级搜索与分析平台
大数据·elasticsearch·搜索引擎
MemoriKu5 天前
Flutter 本地 AI 相册工程收口:从屏幕常亮、标签体系到照片属性后台队列
大数据·人工智能·python·flutter·elasticsearch·搜索引擎·数据库架构
Elastic 中国社区官方博客5 天前
Elasticsearch:使用向量搜索构建现代应用的最佳实践
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
老陈头聊SEO5 天前
长尾关键词优化策略助力SEO效果提升的关键要素
其他·搜索引擎·seo优化
是潮汕的灿灿展吖5 天前
elasticsearch单机版本数据迁移
大数据·elasticsearch·搜索引擎
金融支付架构实战指南5 天前
ES电商检索方案设计案例
大数据·elasticsearch·搜索引擎
LB9678165 天前
外贸企业GEO优化怎么做?独立站AI搜索引擎排名策略详解
大数据·人工智能·搜索引擎·外贸独立站·ai建站·geo优化·ai搜索排名