搜索引擎Elasticsearch了解

1.Lucene 是什么?

2.模块介绍

Lucene是什么:

一种高性能,可伸缩的信息搜索(IR)库

在2000年开源,最初由鼎鼎大名的Doug Cutting开发

是基于Java实现的高性能的开源项目

Lucene采用了基于倒排表的设计原理,可以非常高效地实现文本查找,在底层采用了分段的存储模式,使它在读写时几乎完全避开了锁的出现,大大提升了读写性能

正排表:根据行号找内容

倒排表:根据内容找行号

普通索引,唯一索引,主键 fulltext

数据库

关系型数据库:数据持久,结构化,数据与数据建立外键

非关系型数据库:

键值对数据: Redis

列存储数据库:HBase

文档数据库:(行存储数据库):es,Mongo

图形图像数据库: influshdb

模块介绍:

analysis模块:主要负责词法分析及语言处理,即分词

index模块:主要负责索引的创建工作

store模块:主要负责索引的读写

querParser:主要负责语法分析

serch模块:主要负责对索引的搜索工作

similarity模块:主要负责相关性打分和排序的实现

Elasticsearch介绍

Elasticsearch是什么:

Elasticsearch是一个基于Lucene的搜索服务器

它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulWEB接口

Elasticsearch是用Java语言开发的,并作为Appcha许可条款下的开源软件,是一种流行的企业级搜索引擎

这玩意可靠,迅速

Elasticsearch能做什么

企业搜索:提升任何用例的搜索和发现体验

日志检测:快照且可扩展的日志管理

基础架构检测:对系统质保进行检测和可视化

Maps:实时探索未知数据

SIEM:实时探索

Elasticsearch部署

需要部署JDK环境,因为其为Java所发

安装后进行配置:

复制代码
复制代码
#插件安装方法
复制代码
#方式一:从官网下载ES插件,通常为ZIP格式,解压到/usr/share/elasticsearch/plugins/目录
复制代码
#方式二:使用elasticsearch-plugin命令
复制代码
        #elasticsearch-plugin install file://path/xx.zip
复制代码
        #elasticsearch-plugin install http://addresss/xx
复制代码
        #elasticsearch-plugin install ftp://address/xx
复制代码
#方式三:容器
相关推荐
零基础的修炼7 小时前
[项目]基于正倒排索引的Boost搜索引擎---编写搜索引擎模块 Searcher
搜索引擎
老友@12 小时前
RAG 的诞生:为了让 AI 不再“乱编”
人工智能·搜索引擎·ai·语言模型·自然语言处理·rag
Elastic 中国社区官方博客1 天前
开始使用 Elastic Agent Builder 和 Microsoft Agent Framework
数据库·人工智能·elasticsearch·microsoft·搜索引擎·ai·全文检索
yangmf20402 天前
APM(三):监控 Python 服务链
大数据·运维·开发语言·python·elk·elasticsearch·搜索引擎
yangmf20402 天前
APM(二):监控 Python 服务
大数据·python·elasticsearch·搜索引擎
零基础的修炼2 天前
[项目]基于正倒排索引的Boost搜索引擎---编写建立索引的模块Index
c++·搜索引擎
光算科技2 天前
网站被谷歌标记“不安全”(Not Secure)怎么处理?
安全·搜索引擎
Elastic 中国社区官方博客2 天前
在 Elasticsearch 中实现带可观测性的 agentic 搜索以自动调优相关性
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索