全文检索

Samooyou1 天前
人工智能·python·ai·全文检索·检索
RAG项目案例--02在线检索&过滤流水线为了确保整体流程设计的科学性与执行连贯性,采用 "Top-Down"(自顶向下)的开发模式,以 “总指挥部” 的全局视角统筹推进,具体实施步骤如下:
Jinkxs2 天前
数据库·postgresql·全文检索
PostgreSQL - 全文检索的开启与基础使用👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕PostgreSQL这个话题展开,希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手,还是正在进阶的开发者,希望你都能有所收获!
Elastic 中国社区官方博客4 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
13.7万人,零人工决策:使用 Elasticsearch 实现智能体驱动的灾害响应系统作者:来自 Elastic Alec Carpenter了解当飓风来袭时,Kibana 检测规则、工作流以及 AI 智能体如何自动协同,在无需调度员介入的情况下,将分布在七个基地的 13.7 万名人员完成重新部署与转移。
可乐ea4 天前
java·大数据·spring boot·mysql·elasticsearch·搜索引擎·全文检索
【知识获取与分享社区项目 | 项目日记第 19 天】基于 Elasticsearch 实现关键词检索与业务权重排序在平台中,用户发布的是一篇篇知文,内容包括标题、摘要、标签、Markdown 正文、图片等。如果搜索只用 MySQL 的 LIKE '%关键词%',会有几个明显问题:
Turboex邮件分享5 天前
全文检索
邮件全文检索与搜索优化邮件全文检索的 90% 以上线上故障,既不是倒排索引本身的问题,也不是分布式集群的容量问题,而是邮件特有的 MIME 结构、多语言混合文本与强时间局部性特征,与通用搜索引擎设计假设的根本性冲突。通用搜索的优化经验直接套用到邮件系统,会导致召回率下降 40% 以上,同时 P99 延迟飙升至秒级。 一、中文与多语言分词处理 CJK 字符的歧义性与多语种边界碰撞,是邮件搜索召回率不达标的首要原因。通用分词器针对通用网页文本优化,完全不适应邮件文本的特征。 邮件 Header 与正文必须采用完全隔离的分词策略。R
Elastic 中国社区官方博客6 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·diskbbq
Elasticsearch DiskBBQ:使用原生 SIMD Blocks 实现快 40% 的向量评分计算作者:来自 Elastic Benjamin Trent深入解析 DiskBBQ 的块布局、文档 ID 压缩模式以及原生 SIMD 内核如何协同工作,为 9.4 版本中的 DiskBBQ 带来 40% 的向量评分吞吐量提升。
可乐ea7 天前
java·大数据·elasticsearch·搜索引擎·全文检索
【知识获取与分享社区项目 | 项目日记第 20 天】search_after 游标分页:解决 Elasticsearch 深分页稳定性问题普通业务分页经常这么写:底层对应 MySQL:但在 Elasticsearch 中,如果搜索结果很多,使用 from + size 做深分页会有明显问题:
2601_961194027 天前
考研·elasticsearch·全文检索·代理模式·lucene·桥接模式·访问者模式
考研模拟卷谁的比较好|27李林合工大肖四肖八数学英语408PDF27 考研模拟卷 PDF 见上方链接。真题 ≥2 遍 后再刷模拟;11 月肖八、12 月肖四。下面为 数学 / 101 公共课 / 408 / 英语阅读 模拟卷风格精练(与「模拟卷推荐」篇题目不重复)。
Elastic 中国社区官方博客7 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch Reindex 现已支持跨节点自动迁移:无需人工干预,不会丢失进度作者:来自 Elastic Pete NaylorElasticsearch Reindex 现在能够在节点关闭后继续执行任务,使用 Point in Time(PIT)实现更高效的源数据遍历,并提供专门的管理 API。在 Serverless 中,Reindex-from-remote 现已正式发布。
努力攻坚操作系统7 天前
大数据·数据库·elasticsearch·搜索引擎·全文检索
Elasticsearch 完全教学指南:从入门到精通本文将带你从零开始系统学习 Elasticsearch,涵盖核心概念、使用场景、基础操作、查询语法、聚合分析、底层原理、性能调优等内容。无论你是初学者还是有一定经验的开发者,都能从中获益。
Elastic 中国社区官方博客8 天前
大数据·人工智能·elasticsearch·搜索引擎·github·全文检索·copilot
使用 Elasticsearch 和 GitHub Copilot SDK 构建一个 RAG agent作者:来自 Elastic Greg Crist用五行 C# 代码将 Elasticsearch 接入 GitHub Copilot SDK 作为 RAG 工具,让你的 agent 基于自己的日志、文档和数据进行检索,而不是依赖模型的训练数据。
逸Y 仙X10 天前
java·大数据·服务器·elasticsearch·搜索引擎·全文检索
文章六:ElasticSearch 集群通信安全权限上一章节(文章五:Elasticsearch安全通信-CSDN博客)介绍了如何通过自定义证书文件,构建具备通信安全保障的 Elasticsearch 集群;本章则聚焦于数据权限控制,重点讲解索引增删改查等操作的精细化权限配置方法。
逸Y 仙X11 天前
java·大数据·安全·elasticsearch·搜索引擎·全文检索·jenkins
文章五:Elasticsearch安全通信Elasticsearch 8.X 及以上版本默认启用全新安全模式,不再需要手动生成证书、手动配置密钥,只需在 elasticsearch.yml 中填写基础配置,启动 ES 服务时,程序会自动生成 TLS/SSL 证书、密钥、认证文件,并自动完成:
Elastic 中国社区官方博客11 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elastic 线下 Meetup 将于 2026 年 7 月 26 号下午在深圳举行2026 Elastic Meetup 深圳站活动,由 Elastic、腾讯、新智锦绣联合举办,现诚邀广大技术爱好者及开发者参加。
Elastic 中国社区官方博客11 天前
大数据·数据库·elasticsearch·搜索引擎·serverless·全文检索·时序数据库
Elasticsearch 如何通过 synthetic _id 和 Bloom filters 将时序存储降低 34%作者:来自 Elastic Tanguy Leroux, Francisco Fernández Castaño 及 Anton Persson
garmin Chen12 天前
java·大数据·笔记·elasticsearch·搜索引擎·全文检索
Elasticsearch(1):Elasticsearch核心原理与基础操作总结Elasticsearch 是一个开源的分布式搜索和分析引擎,专为速度、扩展和 AI 应用而打造。作为一个检索平台,它可以实时存储结构化、非结构化和向量数据,
论文小助手W68512 天前
大数据·人工智能·全文检索·智慧城市·交通物流
【ACM出版,EI检索】2026年人工智能与智慧城市国际学术会议(IC-AISC 2026)论文出版:所有的投稿,都必须经过2-3位组委会专家审稿,经过严格的审稿之后,最终所录用的论文将被ACM ICPS出版论文集(ISBN号:979-8-4007-2267-7),见刊后由出版社提交至 EI Compendex和Scopus数据库检索。目前该出版社见刊检索稳定。
Elastic 中国社区官方博客13 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索
Elasticsearch:跨数据库与业务系统进行搜索Elasticsearch 提供多种搜索技术,从 BM25 开始,这是文本搜索的行业标准。它还提供由 AI 模型驱动的语义搜索,可以基于上下文与意图提升搜索结果。
Elastic 中国社区官方博客13 天前
大数据·人工智能·elasticsearch·搜索引擎·信息可视化·全文检索·数据可视化
从平均值到任意百分位:Elasticsearch 在 ES|QL 中提供原生 exponential histogram 支持作者:来自 Elastic Jonas Kunz随时查询任意百分位。Elasticsearch 原生存储 OTel exponential histograms,并允许你在 ES|QL 中分析分布数据,而无需固定桶或有损转换。
Elastic 中国社区官方博客13 天前
大数据·人工智能·elasticsearch·搜索引擎·云原生·全文检索
Elasticsearch Agent Builder 黑客松(Hackathon)作者:来自 Elastic Himanshi Goyal以下是社区所构建的内容今年早些时候,Elastic 举办了 Elasticsearch Agent Builder 黑客松(Hackathon),这是一项邀请开发者使用 Elastic Agent Builder 构建有意义、可运行 AI agents 的挑战。