Elasticsearch - 分布式搜索与分析引擎

文章目录


一、关于 Elasticsearch

1、项目概览

Elasticsearch 是一个分布式搜索与分析引擎,可扩展的数据存储和向量数据库,针对生产级工作负载的速度和相关性进行了优化。作为 Elastic 开源技术栈的核心组件,支持:

  • 海量数据近实时搜索
  • 向量搜索
  • 生成式 AI 应用集成

2、相关链接资源


3、功能特性

  1. 多模态搜索

    • 全文检索
    • 向量搜索
    • 混合搜索
  2. 数据分析

    • 日志分析
    • 指标监控
    • 应用性能管理(APM)
    • 安全日志分析
  3. AI 集成

    • 检索增强生成(RAG)
    • 机器学习创新应用

二、安装配置

1、云服务部署

推荐使用 Elasticsearch Service 快速创建托管集群

2、本地开发环境

bash 复制代码
# 使用 Docker 快速启动(仅限开发测试)
curl -fsSL https://elastic.co/start-local | sh

注意:此配置仅适用于本地开发,生产环境需另行配置。


三、使用示例

1、基础操作

bash 复制代码
# 创建索引
curl -u elastic:$ES_LOCAL_PASSWORD -X PUT http://localhost:9200/my-new-index

2、Python 客户端

python 复制代码
from elasticsearch import Elasticsearch

client = Elasticsearch(
    "http://localhost:9200",
    basic_auth=('elastic', os.getenv('ES_LOCAL_PASSWORD'))
)
print(client.info())

3、数据操作

json 复制代码
// 添加文档
POST /customer/_doc/1
{
  "firstname": "Jennifer",
  "lastname": "Walters"
}

// 批量导入
PUT customer/_bulk
{ "create": { } }
{ "firstname": "Monica","lastname":"Rambeau"}

四、进阶功能

1、从源码构建

bash 复制代码
# 构建本地发行版
./gradlew localDistro

# 构建特定平台版本
./gradlew :distribution:archives:linux-tar:assemble

2、版本升级

参考官方升级指南


其它

参考项目


伊织 xAI 2025-09-23(二)

相关推荐
字节跳动数据平台1 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术3 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康4 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者4 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive