elasticsearch安装分词器和操作

安装分词器

1,查看分词器是否安装
bash 复制代码
# 检查已安装的插件
sudo /usr/share/elasticsearch/bin/elasticsearch-plugin list

如果没有安装,进行安装,此方法安装的时候提示分词器不存在

2,安装分词器
方法一:直接下载安装
bash 复制代码
# 如果 IK 分词器未安装,安装它
sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.10.0/elasticsearch-analysis-ik-7.10.0.zip

用这种方法试试

bash 复制代码
# 创建临时目录
mkdir -p /tmp/ik_plugin
cd /tmp/ik_plugin

# 下载 IK 分词器(使用备用链接)
wget https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-ik/elasticsearch-analysis-ik-7.10.0.zip

# 如果上面的链接不行,尝试从其他源下载
wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.10.0/elasticsearch-analysis-ik-7.10.0.zip

如果还提示404不存在

方法二:从源码编译安装

在码云上搜索elasticsearch-analysis-ik这个

打开连接搜索的链接Gitee根据自己的版本进行下载,我这里下载的是7.10版本

下载完之后解压

bash 复制代码
#解压
sudo unzip elasticsearch-analysis-ik-7.10.zip

如果没有安装maven,进行安装

bash 复制代码
cd elasticsearch-analysis-ik-7.10/
#安装maven
sudo apt install maven
#停止es
sudo systemctl stop elasticsearch
#编译打包
cd elasticsearch-analysis-ik-7.10/

安装分词器

bash 复制代码
sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install ./elasticsearch-analysis-ik-7.10/target/releases/elasticsearch-analysis-ik-7.10.0.zip

成功的界面

备注:这里查看下生成的压缩文件是哪个版本,如果不是elasticsearch-analysis-ik-7.10.0.zip版本,就需要修改pom文件

修改pom文件,如果没有报错,执行执行启动es的那一步

bash 复制代码
# 回到源码目录
cd /home/jing/Downloads/elasticsearch-analysis-ik-7.10

# 修改版本号
nano pom.xml

找到这一行并修改:

bash 复制代码
<elasticsearch.version>7.10.2</elasticsearch.version>

改为

bash 复制代码
<elasticsearch.version>7.10.0</elasticsearch.version>

然后重新编译

bash 复制代码
mvn clean package -DskipTests

再次执行

bash 复制代码
sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install file:///home/jing/Downloads/elasticsearch-analysis-ik-7.10/target/releases/elasticsearch-analysis-ik-7.10.0.zip

启动es

bash 复制代码
sudo systemctl start elasticsearch

查看安装的分词器

bash 复制代码
sudo /usr/share/elasticsearch/bin/elasticsearch-plugin list

显示

bash 复制代码
# 测试 IK 分词器
curl -X GET "http://localhost:9200/_analyze" -H 'Content-Type: application/json' -d'
{
  "analyzer": "ik_smart",
  "text": "中华人民共和国"
}'

es的操作

bash 复制代码
#删除索引
curl -X DELETE "http://localhost:9200/knowledge"
#查看索引
curl -X GET "http://localhost:9200/knowledge"
#查看映射
curl -X GET "http://localhost:9200/knowledge/_mapping"

# 查看索引设置
curl -X GET "http://localhost:9200/knowledge/_settings?pretty"

查看索引中的所有数据

bash 复制代码
# 查看索引中的所有文档
curl -X GET "http://localhost:9200/knowledge/_search?pretty"

# 或者使用 POST 方式
curl -X POST "http://localhost:9200/knowledge/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "match_all": {}
  }
}'
# 查看前5条数据
curl -X GET "http://localhost:9200/knowledge/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "size": 5,
  "query": {
    "match_all": {}
  }
}'```

2. 查看特定文档

```bash
# 根据文档ID查看
curl -X GET "http://localhost:9200/knowledge/_doc/1?pretty"

# 查看多个文档
curl -X GET "http://localhost:9200/knowledge/_doc/1,2,3?pretty"
  1. 搜索特定内容
bash 复制代码
# 搜索包含特定关键词的文档
curl -X GET "http://localhost:9200/knowledge/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "match": {
      "fileName": "测试"
    }
  }
}'

# 多字段搜索
curl -X GET "http://localhost:9200/knowledge/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "multi_match": {
      "query": "测试",
      "fields": ["fileName", "content"]
    }
  }
}'

最常用的几个命令:

bash 复制代码
# 1. 快速查看所有数据
curl -X GET "http://localhost:9200/knowledge/_search?pretty"

# 2. 查看文档数量
curl -X GET "http://localhost:9200/knowledge/_count?pretty"

# 3. 查看映射结构
curl -X GET "http://localhost:9200/knowledge/_mapping?pretty"

# 4. 搜索特定内容
curl -X GET "http://localhost:9200/knowledge/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "match": {
      "fileName": "搜索关键词"
    }
  }
}'
相关推荐
物联网软硬件开发-轨物科技5 分钟前
【轨物洞见】从“人工时代”迈向“视觉语音时代”:轨物科技多模态智能感知与一键顺控专家系统全解析
大数据·人工智能·科技
D愿你归来仍是少年8 分钟前
Apache Spark 第六章:执行计划与 DAG 调度
大数据·spark
大傻^8 分钟前
Spring AI Alibaba 向量数据库集成:Milvus与Elasticsearch配置详解
数据库·人工智能·spring·elasticsearch·milvus·springai·springaialibaba
redsea_HR19 分钟前
红海eHR解决方案背后的底层能力
大数据·数据库·人工智能
无忧智库41 分钟前
破局与重构:大型企业级数字化业务运营平台的深度解构与演进之路(WORD)
大数据·架构
跨境卫士—小依42 分钟前
标题与卖点不聚焦如何重构核心卖点逻辑
大数据·人工智能·跨境电商·亚马逊·营销策略
H_老邪1 小时前
Elasticsearch 本地安装配置
大数据·elasticsearch·搜索引擎
新诺韦尔API1 小时前
手机号携号转网接口对接常见问题一览
大数据·api
企业培训大师2 小时前
深度拆解智能防作弊系统:从技术底层到场景落地
大数据