elasticsearch 8.x 插件安装(四)之简繁体插件

elasticsearch 8.x 插件安装(四)之简繁体插件

elasticsearch插件安装合集

elasticsearch插件安装(一)之ik分词器安装(含MySQL更新)

elasticsearch 8.x插件(二)之同义词安装如何解决jdk权限问题

elasticsearch插件安装(二)之dynamic-synonym插件

elasticsearch 8.x 插件安装(三)之拼音插件

elasticsearch 8.x 插件安装(四)之简繁体插件

es 分词器(五)之elasticsearch-analysis-jieba 8.7.0

elasticsearch 8.x 插件安装(六)之Hanlp插件

一、拉取代码

代码地址:https://github.com/infinilabs/analysis-stconvert

二、打包插件

打开pom文件,将elasticsearch.version修改为需要的版本,此处修改为8.7.0。

在elasticsearch/target/release目录下会找到对应版本的插件

三、安装插件

将压缩包解压并复制到es plugins目录下,然后重启es。

四、验证插件

4.1 创建索引

json 复制代码
PUT /stconvert/
{
    "settings" : {
        "analysis" : {
            "analyzer" : {
                "tsconvert" : {
                    "tokenizer" : "tsconvert"
                    }
            },
            "tokenizer" : {
                "tsconvert" : {
                    "type" : "stconvert",
                    "delimiter" : "#",
                    "keep_both" : false,
                    "convert_type" : "t2s"
                }
            },   
             "filter": {
               "tsconvert" : {
                     "type" : "stconvert",
                     "delimiter" : "#",
                     "keep_both" : false,
                     "convert_type" : "t2s"
                 }
             },
            "char_filter" : {
                "tsconvert" : {
                    "type" : "stconvert",
                    "convert_type" : "t2s"
                }
            }
        }
    }
}

4.2 搜索

json 复制代码
GET stconvert/_analyze
{
  "tokenizer" : "keyword",
  "filter" : ["lowercase"],
  "char_filter" : ["tsconvert"],
  "text" : "国际國際"
}

Output:
{
  "tokens": [
    {
      "token": "国际国际",
      "start_offset": 0,
      "end_offset": 4,
      "type": "word",
      "position": 0
    }
  ]
}

4.3 简繁体互搜

json 复制代码
DELETE index
PUT index
{
  "settings": {
    "analysis": {
      "char_filter": {
        "tsconvert": {
          "type": "stconvert",
          "convert_type": "t2s"
        }
      },
      "normalizer": {
        "my_normalizer": {
          "type": "custom",
          "char_filter": [
            "tsconvert"
          ],
          "filter": [
            "lowercase"
          ]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "foo": {
        "type": "keyword",
        "normalizer": "my_normalizer"
      }
    }
  }
}

PUT index/_doc/1
{
  "foo": "國際"
}

PUT index/_doc/2
{
  "foo": "国际"
}

GET index/_search
{
  "query": {
    "term": {
      "foo": "国际"
    }
  }
}

GET index/_search
{
  "query": {
    "term": {
      "foo": "國際"
    }
  }
}
相关推荐
格子软件1 分钟前
2026年GEO优化系统源码的分布式状态机深度拆解
java·前端·vue.js·vue·geo
C++、Java和Python的菜鸟3 分钟前
第1章 集合高级
java·jvm·python
ShiXZ21313 分钟前
PDF-OCR文件识别篇(八):配置、运维与排错
java·运维·ocr·dubbo·springboot
阿拉斯攀登31 分钟前
向量数据库选型:Milvus vs Chroma vs Elasticsearch
数据库·elasticsearch·milvus·知识库·rag·个人知识库
彦为君41 分钟前
Redis最新版本特性
java·数据库·redis·算法·bootstrap
格子软件1 小时前
2026年GEO优化系统源码解构:核心状态机与高并发流控深度剖析
java·vue.js·spring boot·vue·geo
weixin199701080161 小时前
[特殊字符]《京东订单API(jd.order.detail.get)对接ERP:企业认证+OAuth授权避坑指南》(附Python源码)
java·数据库·python
pW3g3lLuu1 小时前
在 VS Code 里直接改 JAR,我复刻了JarEditor
java·pycharm·jar
Tim_102 小时前
【C++】009、extern关键字
java·开发语言
ShiXZ2132 小时前
PDF-OCR文件识别篇(七):数据入库
java·pdf·json·ocr·springboot