ES实战-分析数据1

分析是文档被发送并加入倒排索引之前,es在其主体上进行的操作,具体如下

1.字符过滤-使用字符过滤器转变字符

2.文本切分为分词-将文本切分为单个或多个分词

3,分词过滤-使用分词过滤器转变每个分词

4.分词索引-将这些分词存储到索引中
为文档使用分析器

1.当创建索引的时候,为特定的索引进行设置-直接生效

2.在es配置文件中,设置全局分析器-需重启生效
在映射中指定某个字段的分析器

bash 复制代码
#为description字段指定myCustomerAnalyzer分析器
{
  "mappings": {
    "document":{
      "properties":{
        "description":{
          "type":"string",
          "analyzer":"myCustomerAnalyzer"
        }
      }
    }
  }
}
#指定不要分析description字段
{
  "mappings": {
    "document":{
      "properties":{
        "description":{
          "type":"string",
          "index":"not_analyzed"
        }
      }
    }
  }
}

使用分析API来分析文本

bash 复制代码
curl -XPOST 'localhost:9200/_analyze' -H 'Content-Type: application/json' -d '{
  "analyzer": "standard",
  "text": "share your experience with NoSql & big data technologies"
}'

请求Elasticsearch返回get-together索引中ID为1的文档,在description和tags字段上的词项向量以及相关统计信息

bash 复制代码
curl -X GET "localhost:9200/get-together/_termvectors/1?pretty=true" -H 'Content-Type: application/json' -d '{
"fields":["description","tags"],
"term_statistics":true
}'

分析器包含:

1.标准分析器:

1.1.标准分词器

1.2.标准分词过滤器

1.3,小写转换分词过滤器

1.4.停用词分词过滤器

2.简单分析器

3.空白分析器

4.停用词分析器

5,关键词分析器

6.模式分析器

7.语言和多语言分析器

8.雪球分析器
分词器包括:

1.标准分词器

2,关键词分词器

3.字母分词器

4.小写分词器

5.空白分词器

6.模式分词器

7.UAX URl电子邮件分词器

8.路径层次分词器
分词过滤器

1.标准分词过滤器

2.小写分词过滤器

3.长度分词过滤器

4.停用词分词过滤器

5.截断分词过滤器,修剪分词过滤器,限制分词数量过滤器

6.颠倒分词过滤器

7.唯一分词过滤器

8.ASCII折叠分词过滤器

9.同义词分词过滤器

相关推荐
贝多芬也爱敲代码19 分钟前
如何减小ES和mysql的同步时间差
大数据·mysql·elasticsearch
异次元的星星1 小时前
智慧新零售时代:施易德系统平衡技术与人力,赋能门店运营
大数据·零售
深思慎考2 小时前
ElasticSearch与Kibana 入门指南(7.x版本)
大数据·elasticsearch·jenkins
银行数字化转型导师坚鹏3 小时前
如何设计优秀的企业微信私域运营实战培训方案
大数据·python·企业微信
悠闲蜗牛�4 小时前
人工智能时代下的全栈开发:整合AI、大数据与云原生的实践策略
大数据·人工智能·云原生
ml魔力信息5 小时前
活体检测与防伪技术的安全与隐私分析
大数据·人工智能·安全·隐私保护·生物识别·活体检测
数据要素X6 小时前
寻梦数据空间 | 架构篇:从概念到落地的技术实践与突破性创新
大数据·运维·数据仓库·微服务·数据治理·数据中台·可信数据空间
IT学长编程7 小时前
计算机毕业设计 基于EChants的海洋气象数据可视化平台设计与实现 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·python·毕业设计·课程设计·毕业论文·海洋气象数据可视化平台
呆呆小金人7 小时前
SQL入门: HAVING用法全解析
大数据·数据库·数据仓库·sql·数据库开发·etl·etl工程师
problc9 小时前
PostgreSQL + Redis + Elasticsearch 实时同步方案实践:从触发器到高性能搜索
redis·elasticsearch·postgresql