全文检索

Elastic 中国社区官方博客4 小时前
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·nvidia
快 12 倍的 Elasticsearch 向量索引:使用 GPU 和 CPU 分层部署 NVIDIA cuVS作者:来自 Elastic Blake Holden在 Elasticsearch 中部署 NVIDIA cuVS GPU 加速 HNSW 索引的两种模式:适用于小型集群的构建与服务一体化节点,以及适用于大规模生产环境、通过 ILM 切换到 CPU 的专用 GPU 摄取层。
石小千12 小时前
mysql·全文检索
mysql8全文检索自然语言搜索 https://dev.mysql.com/doc/refman/8.4/en/fulltext-search.html
逸Y 仙X1 天前
大数据·elasticsearch·搜索引擎·全文检索
文章一:深度掌握Elasticsearch集群组建和集群设置Elasticsearch(ES)是基于Lucene实现的分布式实时检索与分析引擎,其所有高可用、高容错、横向扩展能力,全部依托分布式集群机制实现。很多开发者仅会简单搭建集群,却不理解选主算法、分片分配、故障自愈的底层原理,导致生产环境频繁出现脑裂、集群红、分片丢失、节点无法上线等问题。
随风,奔跑2 天前
elasticsearch·全文检索
Elasticsearch全文检索服务想象一下你在淘宝上搜“手机”,结果 MySQL 在后台翻遍所有商品表、用户表、评论表……像在字典里一页一页找“手”字一样,慢得让人想砸电脑!
逸Y 仙X2 天前
大数据·elasticsearch·搜索引擎·全文检索
文章三十四:ElasticSearch Script脚本实战在 Elasticsearch 中,Painless 脚本根据使用位置不同,拥有完全不一样的运行上下文,能直接调用的内置变量、字段取值方式、可用 API 都存在严格区别。日常开发最常用场景分为:查询脚本字段 script_fields、运行时字段 runtime_mappings、分数计算脚本 script_score、聚合脚本、更新文档脚本,本文统一梳理所有取值规范、可用变量、使用禁忌。
heimeiyingwang2 天前
elasticsearch·架构·全文检索
【架构实战】ElasticSearch搜索集群:全文检索的艺术字数统计:约4200字2019年双十一的那个凌晨,我正在公司值夜班,监控大屏上突然一片飘红——搜索服务响应时间从正常的50ms飙升到3秒以上,订单页面的搜索框彻底卡死。运营同事疯狂@我:“用户搜不了商品了!”
逸Y 仙X3 天前
java·大数据·elasticsearch·搜索引擎·全文检索
文章三十三:Elasticsearch 文本分词器深入实战文本信息通过一定的规则进行拆解,分成独立的词项,便于搜索,基于分词之后的字符去检索。在上面的内置分词器中可以发现,内置的分词器中没有合适的中文分词器。
逸Y 仙X3 天前
java·大数据·elasticsearch·搜索引擎·全文检索
文章三十一:ElasticSearch 管道聚合Elasticsearch 基础聚合主要分为指标聚合和桶聚合两类,仅能实现对原始文档的分组、基础数值统计,满足常规的数据分析需求,但在复杂业务统计、时序数据复盘、指标二次计算等场景中存在明显短板。而管道聚合(Pipeline Aggregation)的出现,完美弥补了基础聚合的缺陷,也是我们业务开发中必须使用它的核心原因。
Elastic 中国社区官方博客3 天前
大数据·elasticsearch·搜索引擎·云原生·容器·kubernetes·全文检索
Kubernetes 可观测性:用于更安全 EKS 故障排查的 MCP 专家 agents作者:来自 Elastic Ramprasad KM在 Elastic AI Agent 进行故障排查时,为集群检查限定一个专家 EKS MCP agent;通过几个提示使用该专家 agent 修复服务配置错误。
Elastic 中国社区官方博客4 天前
大数据·elasticsearch·搜索引擎·信息可视化·全文检索
Elastic 开源社区行为准则欢迎来到 Elastic 社区!很高兴你来到这里,我们也期待看到你的贡献。Elastic 致力于为 Elastic 开源社区(“社区”)中的每一个人提供积极的体验,无论年龄、种姓、公民身份、残障情况、教育背景、族裔、性别认同或表达、移民身份、经验水平、神经多样性、外貌或体型、国籍、社会经济地位、性取向、种族或宗教(或无宗教信仰)如何。我们的产品天然是分布式的,并且涉及多种语言、视角与文化,因此在沟通过程中很容易出现 “翻译中的信息损失”。请尊重文化差异,不要轻易假设他人存在恶意。我们不容忍任何形式的骚扰或
逸Y 仙X4 天前
android·大数据·elasticsearch·搜索引擎·全文检索
文章二十九:ElasticSearch分桶聚合本文聚焦 ElasticSearch(简称 ES)核心能力——分桶聚合(Bucket Aggregation),从核心原理、聚合分类、核心参数详解、语法详解、实战案例、嵌套组合、踩坑问题及性能优化全方位讲解。分桶聚合是 ES 数据分析的核心,核心作用是将海量文档按照指定规则划分为若干数据桶,实现数据分组统计,对标 MySQL 中 GROUP BY 语法,广泛应用于日志分析、业务统计、出行数据分析、数据看板、多维数据分析等场景。
Elastic 中国社区官方博客4 天前
大数据·数据库·搜索引擎·云原生·容器·kubernetes·全文检索
在 Kubernetes 上的 Elastic Cloud:简化的可用区感知、重启和 mTLS作者:来自 Elastic Omer KushmaroECK 3.4 将可用区感知的高可用从 40 行 YAML 简化为一个字段,通过 annotation 添加声明式滚动重启,并自动配置 Kibana 与 Elasticsearch 之间的 mTLS。
Elastic 中国社区官方博客5 天前
大数据·elasticsearch·搜索引擎·云原生·serverless·全文检索
通过项目标签和路由,在 Elasticsearch Serverless 中实现更快的跨项目搜索作者:来自 Elastic Stas Malyshev 及 Luigi Dell'Aquila在 Elasticsearch Serverless 中,使用项目路由将跨项目搜索范围限定为完全跳过不匹配的项目,或使用项目标签字段在查询内部按标签进行过滤、聚合和排序。
平行侠5 天前
全文检索
A20 工业维护日志全文检索系统本项目源自《计算机程序设计艺术》(TAOCP)算法库的知识的系统化工程落地。哈希表自1953年Luhn发明以来一直是无序数据 O(1) 查找的代名词。而Knuth在TAOCP卷3 §6.5中深入讨论了倒排索引技术——将"文档→词项"的正向关系反转,构建"词项→文档列表"的索引结构,这是现代搜索引擎的核心基石。
Elastic 中国社区官方博客6 天前
大数据·数据库·elasticsearch·搜索引擎·全文检索
在 Elasticsearch 中使用利润率与流行度加权来优化电商搜索作者:来自 Elastic Alexander Marquardt, Honza Král 及 Taylor Roy
Elastic 中国社区官方博客6 天前
大数据·人工智能·elasticsearch·搜索引擎·全文检索
Elasticsearch Vector DiskBBQ 过滤搜索现已提升 3 – 5 倍速度作者:来自 Elastic Benjamin Trent了解 Elasticsearch 9.4 如何通过避免在高选择性场景下浪费 centroid 和 postings-list 工作,使受限过滤条件下的 DiskBBQ 向量搜索速度提升 3–5 倍,并且更加稳定。
deephub6 天前
人工智能·全文检索·大语言模型·rag
HyDE :让 RAG 检索从“匹配关键词“升级到“理解意图“做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。
逸Y 仙X7 天前
java·大数据·sql·elasticsearch·搜索引擎·全文检索
文章三十:Elasticsearch SQL实战案例在日常 Elasticsearch(简称 ES)开发中,绝大多数开发者习惯使用原生 DSL 语句实现数据查询、检索与聚合统计。但 ES DSL 存在语法繁琐、学习成本高、可读性差、业务对接效率低等问题,对于后端开发、数据分析人员并不友好。
莽撞的大地瓜7 天前
自然语言处理·全文检索·中文分词
多模态内容校对智能体新突破:蜜度校对通以全流程自动化重塑校对标准在信息爆炸的时代,内容生产的效率与准确性成为组织竞争力的核心要素。蜜度推出的多模态内容校对智能体,凭借全流程自动化校对能力与多模态文件兼容性,为政务、媒体、企业等领域提供了高效、精准的内容质检解决方案,重新定义了智能校对的行业标准。
Elastic 中国社区官方博客7 天前
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索
Elasticsearch ES|QL “读取时模式”:你的未映射字段一直都在那里作者:来自 Elastic Tyler PerkinsES|QL 的新未映射字段功能使任何从未映射的字段都可以针对历史数据进行查询(无需重新索引)。