elasticsearch

Elastic 中国社区官方博客4 小时前
大数据·运维·分布式·elasticsearch·搜索引擎·信息可视化·全文检索
使用 Elastic 中的 OpenTelemetry 为 Nginx 实现端到端分布式追踪的实用指南作者:来自 Elastic Frederic Maussion使用 OpenTelemetry 跟踪模块为 Nginx 进行埋点,并将 spans 导出到 Elastic Observability 的 APM,实现完整的端到端分布式追踪。
Elastic 中国社区官方博客8 小时前
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina
JINA AI 与 Elasticsearch 的集成Jina AI现在是 Elastic 的一部分,将其高性能多语言和多模态搜索 AI 带入 Elasticsearch 强大的数据存储、检索和索引能力。Jina AI 模型可以通过公共 API 与 Elasticsearch 集成,测试可获得 1000 万个免费 tokens。
tebukaopu14810 小时前
大数据·elasticsearch·搜索引擎
es searchSourceBuilder.trackTotalHits(true);的作用核心含义与作用 这行代码是 Elasticsearch Java 客户端(Rest High Level Client)中的关键配置,用于让 Elasticsearch 返回精准的搜索结果总命中数,而非默认的近似值。 先理解默认行为(为什么需要这个配置) Elasticsearch 为了提升查询性能,默认不会返回精准的总命中数: 当匹配的文档数较少(比如 < 10000 条),可能返回近似值; 当匹配的文档数超过 10000 条时,默认只返回 10000(或显示 10000+),不会计算真实的总条数。 这
single-life12 小时前
linux·运维·elasticsearch·nebula
Linux 下 部署es+nebula(附带内网部署方式)仅记录学习过程,有问题欢迎讨论接上文windows下,贴一个实测可用的在linux下部署nebula+es的流程。由于可能要去客户内部部署(无外网),所以包都得自己提前准备好。
一个向上的运维者13 小时前
elasticsearch·云原生
实战解析|EFK 日志系统数据同步问题全解(附核心配置模板)在云原生和分布式架构中,EFK(Fluentd+Elasticsearch+Kibana)作为主流的日志采集分析系统,被广泛应用于日志的采集、存储与可视化。但在生产环境中,由于网络波动、组件故障、负载过高、配置不合理等问题,极易出现数据丢失、重复、延迟、可视化不同步等数据同步问题,直接影响日志的完整性和可分析性。 本文将从 EFK 各组件协同的角度,拆解数据同步的核心痛点,给出从采集、传输、存储到可视化的全链路解决方案,并附上可直接复用的核心配置模板,助力开发者快速解决生产环境中的 EFK 数据同步问题。
cicada1514 小时前
大数据·git·elasticsearch
分享一个git日常开发流程分享一个使用git的工作流程:每天上班之前从远程仓库更新master分支到本地开发分支,每天下班前提交代码到远程开发分支,定期将测试后的远程开发分支跟master分支合并。下面用一个流程图来展示整个流程的全貌:
_oP_i14 小时前
大数据·windows·elasticsearch
Windows 下往 Elasticsearch 添加数据Windows 下往 Elasticsearch 添加数据,只有这 4 种正经方式:我按你当前阶段,从最合理到最不该用的顺序讲。
咕叽咕叽的汪15 小时前
运维·spring boot·elasticsearch·docker·容器·devops
Es/Kibana7.17.9中数据迁移到openSearch3.4.0【DockerDesktop模拟】本文介绍如何在 Windows 环境下,通过 Docker Desktop 搭建 Elasticsearch 与 Kibana,模拟数据迁移,包括 索引结构、索引数据以及 Kibana 的 Index Pattern 的迁移。
萧曵 丶15 小时前
java·elasticsearch
Elasticsearch 高频面试题(高级 Java 开发版)Elasticsearch 是什么?和传统关系型数据库(MySQL)的核心区别是什么?ES 的核心组件(Index、Type、Document、Shard、Replica)分别是什么?Type 为什么在 7.x 被废弃?
SpaceAIGlobal16 小时前
大数据·elasticsearch·搜索引擎
基于 Elasticsearch 实现排序沉底与前置的方法解析在搜索业务场景中,经常需要根据特定字段调整排序评分,从而实现目标结果前置(置顶)或非目标结果后置(沉底)的需求。以商机管理的“扫街拓客”场景为例,当寻找目标商户时,核心筛选维度包括:距离远近、GMV 潜力大小、被跟进次数多少。从策略设计来看,距离远近的权重应高于 GMV 潜力——优先选择就近可拜访的商户;在距离相近的前提下,再优先筛选 GMV 潜力更大的商户。
invicinble16 小时前
android·大数据·elasticsearch
认识es的多个维度我们认识ES,认识到什么程度,会用到什么程度才算真正的认识呢。我想我们可以从这几个角度去认识es 1.部署的角度 2.dsl,创建json格式,创建mapping,映射 3.springboot兼容es,使用java操作es 4.实际项目中es的具体接口。
极客先躯1 天前
linux·git·elasticsearch
如何自动提取Git指定时间段的修改文件?Win/Linux双平台解决方案因为 powershell执行的ps1 文件环境有点复杂没有写,cmd够用了
Elastic 中国社区官方博客1 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Elastic:DevRel 通讯 — 2026 年 1 月作者:来自 Elastic DevRel team来自 Elastic DevRel 团队的问候!在本期通讯中,我们介绍了首批 Elastic Jina models、免费按需培训、最新博客和视频,以及即将举办的活动。
Elastic 中国社区官方博客1 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·jina
jina-embeddings-v3 现已在 Elastic Inference Service 上可用作者:来自 Elastic Sean Handley 及 Ranjana Devaji亲身体验 Elasticsearch:深入了解我们的示例 notebooks,开始免费的 cloud 试用,或立即在本地机器上试用 Elastic。
Elastic 中国社区官方博客1 天前
大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索·jina
使用 jina-embeddings-v3 和 Elasticsearch 进行多语言搜索在本教程中,我们将使用 jina-embeddings-v3 text embedding 模型,通过 Elastic Cloud APIs 构建一个多语言语义搜索系统。
Albert Edison1 天前
git·elasticsearch·svn·github
【Git】多人协作二(不同分支下)一般情况下,如果有多需求需要多人同时进行开发,是不会在一个分支上进行多人开发,而是一个需求或一个功能点就要创建一个 feature 分支。
脑壳疼___2 天前
大数据·elasticsearch·搜索引擎
springAi集成es向量库然后就可以看官网示例进行rag相关操作了比如:
优秀的颜2 天前
elasticsearch·搜索引擎
Elasticsearch(7.x)Elasticsearch(简称 ES) 是一个开源的、分布式的、高度可扩展的搜索和分析引擎。ES 经常与 Logstash(数据收集和处理管道)和 Kibana(数据可视化)一起使用,组成著名的 ELK Stack(现在官方称为 Elastic Stack),能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视化。
Elastic 中国社区官方博客2 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
Elasticsearch:Jina Reranker v3现代搜索pipelines 很少直接从检索中返回最终答案。即使你的 search 系统由高质量的索引或语义检索方法驱动,前几名结果中仍可能包含相关但不一定是最佳答案的候选内容。
Elastic 中国社区官方博客2 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
Elasticsearch:Jina Reader从网页和文档中提取可用文本比看起来更具挑战性。HTML 页面将有意义的内容与布局元素、脚本、广告和样式规则混合在一起,而 PDF 文件则围绕打印逻辑进行结构化,而非自然的文本流。如果没有可靠的方法来解析这些格式,即使是简单的提取也可能变得不一致且难以自动化。