Apache Lucene 9.9,有史以来最快的 Lucene 版本

作者:Adrien Grand

Apache Lucene 的开发一直充满活力,但在过去的几个月中,查询评估的优化数量特别多。 没有一项优化是可以单独挑选出来的,而是围绕机械同情心(对底层硬件和系统特性的理解是通过多方面的改进来实现的,而不是依赖于单一的优化方法)和改进算法的许多改进的组合。

这里特别有趣的是,这些优化不仅有利于一些非常具体的情况,它们还转化为 Lucene 夜间基准测试的实际加速,旨在跟踪代表现实世界的查询的性能。 只需将鼠标悬停在注释上即可查看加速(或有时减速!)来自何处。 顺便说一句,特别感谢 Mike McCandless 近 13 年来一直在自己的时间和硬件上维护 Lucene 的夜间基准

以下是夜间基准测试在 Lucene 9.6(2023 年 5 月)和 Lucene 9.9(2023 年 12 月)之间观察到的一些加速:

如果你对这些更改感到好奇,以下是描述我们应用的一些优化的资源:

Lucene 9.9 刚刚发布,预计将集成到很快发布的 Elasticsearch 8.12 中。 敬请关注!

原文:Apache Lucene 9.9, the fastest Lucene release ever --- Elastic Search Labs

相关推荐
斯特凡今天也很帅16 小时前
Elasticsearch数据库专栏(一)Kinaba的基础使用
elasticsearch·kibana
不爱吃糖的程序媛1 天前
鸿蒙三方库适配读懂 `thirdparty/AES/.gitignore`:哪些文件不该进 Git?
git·elasticsearch·harmonyos
A__tao1 天前
一键实现 SQL → ES Mapping 转换,支持自定义 `text` 为 `json` 转换
sql·elasticsearch·json
ShawnLiaoking1 天前
pycharm 上传更新代码
ide·elasticsearch·pycharm
果粒蹬i2 天前
Elasticsearch 单机部署实测:安装流程、常见坑点与远程访问配置
大数据·elasticsearch·搜索引擎
AC赳赳老秦2 天前
OpenClaw数据库高效操作指南:MySQL/PostgreSQL批量处理与数据迁移实战
大数据·数据库·mysql·elasticsearch·postgresql·deepseek·openclaw
历程里程碑2 天前
二叉树---二叉树的中序遍历
java·大数据·开发语言·elasticsearch·链表·搜索引擎·lua
Elastic 中国社区官方博客2 天前
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina
ACGkaka_2 天前
ES 学习(九)从文本到词元:分词器如何“拆解“你的数据
大数据·学习·elasticsearch
Elastic 中国社区官方博客2 天前
如何使用 LogsDB 降低 Elasticsearch 日志存储成本
大数据·运维·数据库·elasticsearch·搜索引擎·全文检索·可用性测试