全文检索

三天不学习3 小时前
全文检索·.net·lucene
Lucene.NET + Jieba分词:核心词典与停用词配置详解在中文搜索场景中,Lucene.NET 结合 Jieba分词 能显著提升文本处理能力。但实际应用中,dict.txt(核心词典)、cn_synonym.txt(同义词库)和 stopwords.txt(停用词表)的配置直接影响分词效果和搜索质量。本文将详细介绍这三个文件的作用、格式及实战用法。
Elastic 中国社区官方博客3 小时前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch 8.18 中提供了原生连接 (Native Joins)作者:来自 Elastic Costin Leau探索 LOOKUP JOIN,这是一条在 Elasticsearch 8.18 的技术预览中提供的新 ES|QL 命令。
Elastic 中国社区官方博客7 小时前
大数据·数据库·elasticsearch·搜索引擎·全文检索·logstash
如何在不同版本的 Elasticsearch 之间以及集群之间迁移数据作者:来自 Elastic Kofi Bartlett当你想要升级一个 Elasticsearch 集群时,有时候创建一个新的独立集群并将数据从旧集群迁移到新集群会更容易一些。这让用户能够在不冒任何停机或数据丢失风险的情况下,在新集群上使用所有应用程序测试其所有数据和配置。
Elastic 中国社区官方博客1 天前
大数据·数据库·人工智能·神经网络·elasticsearch·搜索引擎·全文检索
Elasticsearch:AI 助理 - 从通才到专才作者:来自 Elastic Thorben Jändling在 AI 世界中,关于构建针对特定领域定制的大型语言模型(large language models - LLM)的话题备受关注 —— 不论是为了更好的安全性、上下文理解、专业能力,还是更高的准确率。这个想法非常诱人:还有什么比一个专为你量身打造的 AI 更能解决你独特问题的方式呢?
Elastic 中国社区官方博客3 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch:使用稀疏向量提升相关性作者:来自 Elastic Vincent Bosc学习如何在 Elasticsearch 中使用稀疏向量,以最小的复杂性提升相关性并实现搜索结果个性化。
Full Stack Developme4 天前
python·sql·全文检索
SQL 全文检索原理全文检索(Full-Text Search)是SQL中用于高效搜索文本数据的技术,与传统的LIKE操作或简单字符串比较相比,它能提供更强大、更灵活的文本搜索能力。
Elastic 中国社区官方博客5 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch:加快 HNSW 图的合并速度作者:来自 Elastic Thomas Veasey 及 Mayya Sharipova过去,我们曾讨论过搜索多个 HNSW 图时所面临的一些挑战,以及我们是如何缓解这些问题的。当时,我们也提到了一些计划中的改进措施。本文正是这项工作的成果汇总。
OceanBase数据库官方博客6 天前
全文检索·oceanbase·分布式数据库·产品特性
OceanBase V4.3.5 上线全文索引功能,让数据检索更高效近日,OceanBase 4.3.5 BP1 版本正式推出了企业级全文索引功能。该版本在中文分词、查询效率及混合检索能力上进行了全面提升。经过自然语言模式和布尔模式在不同场景下的对比测试,OceanBase 的全文索引性能明显优于 MySQL。
Elastic 中国社区官方博客7 天前
大数据·人工智能·elasticsearch·机器学习·搜索引擎·ai·全文检索
将 CrewAI 与 Elasticsearch 结合使用作者:来自 Elastic Jeffrey Rengifo学习如何使用 CrewAI 为你的代理团队创建一个 Elasticsearch 代理,并执行市场调研任务。
铭毅天下7 天前
大数据·elasticsearch·搜索引擎·全文检索
Elasticsearch 8.X 如何利用嵌入向量提升搜索能力?众所周知,Elasticsearch 是一个非常流行的搜索引擎,因为它速度快、扩展性强,尤其擅长全文搜索。
三天不学习12 天前
全文检索·.net·lucene
基于 .NET 8 + Lucene.Net + 结巴分词实现全文检索与匹配度打分实战指南本文详细讲解如何利用 .NET 8、Lucene.Net 和结巴分词(Jieba)实现高效的全文检索功能,并支持搜索结果按匹配度排序。内容涵盖环境搭建、索引管理、分词优化、动态更新策略及实战代码示例,助您快速构建高性能中文搜索引擎。
yangmf204016 天前
大数据·linux·运维·人工智能·elasticsearch·搜索引擎·全文检索
私有知识库 Coco AI 实战(一):Linux 平台部署Coco AI 是一个完全开源、跨平台的统一搜索和生产力工具,能够连接各种数据源,包括应用程序、文件、Google Drive、Notion、Yuque、Hugo 等,帮助用户快速智能地访问他们的信息。通过集成 DeepSeek 等大型模型,Coco AI 实现了智能个人知识管理,并支持私有部署。
Elastic 中国社区官方博客16 天前
大数据·人工智能·elasticsearch·机器学习·搜索引擎·ai·全文检索
Elasticsearch:理解政府中的人工智能 - 应用、使用案例和实施作者:来自 Elastic Elastic Platform Team人工智能技术在私营部门无处不在。人工智能在商业中的应用稳步改变着效率、生产力和盈利能力。然而,在公共部门,人工智能的采用速度比其他行业慢。从州到联邦政府机构,人工智能有可能通过增强决策、简化操作和改善市民服务来彻底改变公共行政。它为解决社会挑战,如食品不安全、环境问题和公共安全,提供了机会。
Elastic 中国社区官方博客17 天前
大数据·人工智能·elasticsearch·搜索引擎·pdf·全文检索·azure
Elasticsearch:使用 Azure AI 文档智能解析 PDF 文本和表格数据作者:来自 Elastic James Williams了解如何使用 Azure AI 文档智能解析包含文本和表格数据的 PDF 文档。
光仔December17 天前
elasticsearch·搜索引擎·全文检索·ik分词器·restclient
【Elasticsearch入门到落地】10、初始化RestClient接上篇《9、hotel数据结构分析》 上一篇我们讲解了导入的宾馆数据库tb_hotel表结构的具体含义,并分析如何建立其索引库。本篇我们来正式进入链接Elasticsearch的Java代码的编写阶段,先进行RestClient的初始化。
梦想画家19 天前
全文检索·sqlalchemy
SQLAlchemy关键词搜索技术深度解析:从基础过滤到全文检索在数据驱动的应用开发中,基于关键词的模糊查询是常见的业务需求。SQLAlchemy作为Python生态中最流行的ORM框架,提供了多种实现关键词搜索的技术方案。本文将从性能、适用场景和技术复杂度三个维度,系统对比分析SQLAlchemy中关键词搜索的最佳实践。
码农爱java20 天前
大数据·elasticsearch·全文检索·jenkins·springboot·es·es 查询
Elasticsearch 之 ElasticsearchRestTemplate 普通查询前言:上一篇我们分享了 Spring Boot 整合 Elasticsearch 使用 ElasticsearchRepository 完成简单的增删改查,我们发现 ElasticsearchRepository 中很多稍微复杂一些的查询就会显示方法过期,对于 Elasticsearch 7.X 版本,我们可以使用 ElasticsearchRestTemplate 来进行相关增删改查。
Elastic 中国社区官方博客23 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch:构建 AI 驱动的搜索体验当你开始使用 Elastic 时,你将使用 Elasticsearch Relevance Engine™(ESRE),它专为 AI 搜索应用程序提供支持。借助 ESRE,你可以利用一整套开发者工具,包括 Elastic 的文本搜索、向量数据库以及我们专有的用于语义搜索的 Transformer 模型。
梦想画家23 天前
全文检索·sqlalchemy
SQLAlchemy系列教程:全文检索实战指南全文搜索指的是搜索引擎能够扫描数据库中的文本内容,以查找与搜索查询相匹配的内容。与可能仅查看特定列或行的传统搜索不同,全文搜索会分析指定列中的所有文本,从而返回更全面和相关的结果。 在 Web 应用程序中实现全文搜索可以显著提升用户体验,使用户更轻松、更高效地找到特定信息。在 Python Web 开发领域,SQLAlchemy 是一个强大的 ORM(对象关系映射)工具包,它简化了数据库管理和操作。本教程将深入探讨如何在 SQLAlchemy 中实现全文搜索,让您能够为应用程序添加复杂的搜索功能。
Elastic 中国社区官方博客25 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elasticsearch:可配置的推理 API 端点分块设置作者:来自 Elastic Daniel RubinsteinElasticsearch 开放推理 API 现已支持可配置的分块,以便在文档摄取时处理语义文本字段。