全文检索

Elastic 中国社区官方博客4 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
理解 Elasticsearch 中的分块策略作者:来自 Elastic Alexander Dávila学习 Elasticsearch 中文档分块的基础知识,比较不同的分块策略,并了解你的分块选择如何影响搜索质量和相关性。
是犹橐籥5 天前
搜索引擎·全文检索·lucene
头歌Educoder答案 Lucene - 全文检索入门任务描述 本关任务:使用lucene完成索引库的创建。相关知识 如果你还没有接触过Lucene,那么强烈建议你查看背景知识了解Lucene的基础知识和开发环境的配置,如果你已经学习过Lucene那么你可以根据下列知识尝试完成本关任务。
Elastic 中国社区官方博客6 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
使用 Elasticsearch 构建 AI Agentic 工作流作者:来自 Elastic Anish Mathur 及 Dana JuratoniElasticsearch 与行业领先的 Gen AI 工具和服务商有原生集成。查看我们的网络研讨会,了解如何超越 RAG 基础,或使用 Elastic 向量数据库构建可投入生产的应用。
Elastic 中国社区官方博客7 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
使用 TwelveLabs 的 Marengo 视频嵌入模型与 Amazon Bedrock 和 Elasticsearch作者:来自 Elastic Dave Erickson创建一个小应用来搜索来自 TwelveLabs 的 Marengo 模型的视频嵌入
Elastic 中国社区官方博客7 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
在 Elasticsearch 和 GCP 上的混合搜索和语义重排序作者:来自 Elastic Jhon Guzmán学习如何仅使用 GCP 组件和 Elasticsearch 构建一个带语义重排序器的完整混合搜索应用。
zyplayer-doc7 天前
人工智能·编辑器·全文检索·飞书·企业微信·开源软件·有道云笔记
知识库新增三方应用AI问答,新增标签管理,集成Excalidraw,重构全文检索,zyplayer-doc 2.5.4 发布啦!zyplayer-doc是一款适合企业和个人使用的WIKI知识库管理工具,支持在线编辑富文本、Markdown、表格、Office文档、API接口、思维导图、Drawio、Excalidraw以及任意的文本文件,支持基于知识库的AI问答,专为私有化部署而设计,最大程度上保证企业或个人的数据安全,支持以内网的方式来部署使用。
一路向北North17 天前
搜索引擎·全文检索·lucene
lucene渲染未命中最匹配的关键词和内容原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。
阿里嘎多哈基米18 天前
elasticsearch·搜索引擎·全文检索·kibana·倒排索引
ES——(三)DSL高级查询Query DSL概述: Domain Specific Language(领域专用语言),Elasticsearch提供了基于JSON的DSL来定义查询。
Elastic 中国社区官方博客18 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·信息可视化·全文检索
使用 LangExtract 和 Elasticsearch作者:来自 Elastic Jeffrey Rengifo学习如何使用 LangExtract 从自由文本中提取结构化数据,并将其作为字段存储在 Elasticsearch 中。
Elastic 中国社区官方博客20 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·语言模型·全文检索
带地图的 RAG:多模态 + 地理空间 在 Elasticsearch 中作者:来自 Elastic Alexander Dávila将多模态 RAG 功能与 Elasticsearch 的核心功能结合起来,例如地理空间查询和词汇搜索。
chanalbert20 天前
人工智能·深度学习·全文检索
信息检索技术综述:从传统稀疏检索到现代深度学习方法本文系统综述了信息检索领域的关键技术与算法发展历程。从基于关键词匹配的传统稀疏检索方法,到基于深度学习的稠密检索技术,再到结合两者优势的混合检索方案,以及多向量检索、学习式稀疏检索等前沿进展,本文全面分析了各类方法的理论基础、算法实现、优势局限及应用场景。研究表明,信息检索技术正朝着稀疏与稠密方法融合、效率与效果平衡、通用性与专业化结合的方向发展,为搜索引擎、问答系统和检索增强生成等应用提供强大支撑。
Elastic 中国社区官方博客20 天前
大数据·人工智能·elasticsearch·搜索引擎·全文检索
Elasticsearch:智能搜索的 MCP作者:来自 Elastic Sunile Manjee 及 Justin Castilla通过将 Elastic 的智能查询层与 MCP 集成来构建智能搜索系统,以增强 LLMs 的生成效果。
Elastic 中国社区官方博客21 天前
大数据·开发语言·数据库·python·elasticsearch·搜索引擎·全文检索
介绍 Python Elasticsearch Client 的 ES|QL 查询构建器作者:来自 Elastic Miguel Grinberg学习如何使用 ES|QL 查询构建器,这是一个新的 Python Elasticsearch client 功能,可以更轻松地使用熟悉的 Python 语法构建 ES|QL 查询。
田野里的雨22 天前
linux·运维·服务器·全文检索
manticore离线安装(Ubuntu )Ubuntu 24.04 LTS:1、解压2、配置本地软件源3、更新本地软件源缓存4、安装 Manticore Search
Elastic 中国社区官方博客22 天前
大数据·数据库·elasticsearch·搜索引擎·kubernetes·k8s·全文检索
使用 cloud-native Elasticsearch 与 ECK 运行作者:来自 Elastic Eva Ramon学习使用 Terraform 部署 GKE,并在 Kubernetes 上通过 ECK 运行 Elastic Stack 组件。
Elastic 中国社区官方博客1 个月前
java·大数据·elasticsearch·搜索引擎·全文检索
Elasticsearch 的 JVM 基础知识:指标、内存和监控作者:来自 Elastic Nitish PandeyElasticsearch 是一个基于 Java 的搜索与分析引擎和向量数据库,构建于 Apache Lucene 之上,它是 Elastic 搜索 AI 平台的核心。要在支持的平台上运行 Elasticsearch,你需要一个 Java 虚拟机(JVM)。JVM 提供了一个平台无关的运行环境,你可以在现有操作系统上运行 Elasticsearch 的虚拟环境。JVM 抽象了底层操作系统和硬件,使 Java 应用能够在任何平台上运行。
cyh男1 个月前
搜索引擎·全文检索·lucene
Lucene 8.7.0 版本的索引文件格式Lucene 8.7.0 版本的索引文件格式非常丰富,每种文件都有特定的作用。以下是主要的文件格式及其功能:
歪歪1001 个月前
运维·开发语言·qt·解释器模式·全文检索·嵌入式实时数据库
如何在Qt Creator中快速定位代码中的注释?Qt Creator的查找功能支持通过特定模式匹配注释内容:在Qt Creator右侧的"Outline"面板(可通过 View > Panels > Outline 开启)中:
在未来等你1 个月前
elasticsearch·搜索引擎·面试·全文检索·lucene·分词·倒排索引
Elasticsearch面试精讲 Day 5:倒排索引原理与实现【Elasticsearch面试精讲 Day 5】倒排索引原理与实现在“Elasticsearch面试精讲”系列的第五天,我们将深入探讨搜索引擎最核心的技术基石——倒排索引(Inverted Index)。作为全文检索系统的灵魂,倒排索引直接决定了Elasticsearch的搜索性能与效率。本篇内容聚焦于倒排索引的构建原理、数据结构设计、分词与词项处理流程,以及其在Lucene底层的实现机制。这些知识点不仅是Elasticsearch面试中的高频考点,更是评估候选人是否真正理解搜索引擎工作原理的关键。通过
playStudy1 个月前
python·搜索引擎·github·全文检索·中文分词·solr·lucene
从0到1玩转 Google SEO使用 application/ld+json 注入 Schema.org:行动项 : 每周检查 GSC 覆盖率报告,修复 404、重定向链、服务器错误。