Apache Lucene 9.9,有史以来最快的 Lucene 版本

作者:Adrien Grand

Apache Lucene 的开发一直充满活力,但在过去的几个月中,查询评估的优化数量特别多。 没有一项优化是可以单独挑选出来的,而是围绕机械同情心(对底层硬件和系统特性的理解是通过多方面的改进来实现的,而不是依赖于单一的优化方法)和改进算法的许多改进的组合。

这里特别有趣的是,这些优化不仅有利于一些非常具体的情况,它们还转化为 Lucene 夜间基准测试的实际加速,旨在跟踪代表现实世界的查询的性能。 只需将鼠标悬停在注释上即可查看加速(或有时减速!)来自何处。 顺便说一句,特别感谢 Mike McCandless 近 13 年来一直在自己的时间和硬件上维护 Lucene 的夜间基准

以下是夜间基准测试在 Lucene 9.6(2023 年 5 月)和 Lucene 9.9(2023 年 12 月)之间观察到的一些加速:

如果你对这些更改感到好奇,以下是描述我们应用的一些优化的资源:

Lucene 9.9 刚刚发布,预计将集成到很快发布的 Elasticsearch 8.12 中。 敬请关注!

原文:Apache Lucene 9.9, the fastest Lucene release ever --- Elastic Search Labs

相关推荐
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
海兰5 天前
离线合同结构化提取与检索:LangExtract + 本地DeepSeek + Elasticsearch 9.x
大数据·elasticsearch·django
yumgpkpm5 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Sheffield5 天前
如果把ZooKeeper按字面意思比作动物园管理员……
elasticsearch·zookeeper·kafka
嗝屁小孩纸5 天前
ES索引重建(零工具纯脚本执行)
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客5 天前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina
Elastic 中国社区官方博客5 天前
Elastic 公共 roadmap 在此
大数据·elasticsearch·ai·云原生·serverless·全文检索·aws
码云数智-大飞5 天前
像写 SQL 一样搜索:dbVisitor 如何用 MyBatis 范式颠覆 ElasticSearch 开发
sql·elasticsearch·mybatis