lucene渲染未命中最匹配的关键词和内容

lucene 搜索时未命中匹配度最高的关键语句怎么办

原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。

解决办法:

高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。

java 复制代码
        String highlight_left_temp ="<span style='color:red'>";
        String highlight_right_temp ="</span>";
        //高亮显示
        SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter(highlight_left_temp, highlight_right_temp);
        Highlighter highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
        //高亮后的段落范围在100字内
        Fragmenter fragmenter = new SimpleFragmenter(100);
        highlighter.setTextFragmenter(fragmenter);
        highlighter.setMaxDocCharsToAnalyze(Integer.MAX_VALUE); //关键设置
相关推荐
在未来等你5 小时前
Elasticsearch面试精讲 Day 18:内存管理与JVM调优
大数据·分布式·elasticsearch·搜索引擎·面试
婲落ヽ紅顏誶6 小时前
测试es向量检索
大数据·elasticsearch·搜索引擎
阿里嘎多哈基米1 天前
ES——(三)DSL高级查询
elasticsearch·搜索引擎·全文检索·kibana·倒排索引
Cachel wood1 天前
信息检索、推荐系统模型排序质量指标:AP@K和MAP@K
windows·搜索引擎·json·推荐系统·搜索
树荫下的光斑1 天前
搜索引擎收录网站带www和不带www有区别吗?
搜索引擎
橘子131 天前
C++实战:搜索引擎项目(二)
开发语言·c++·搜索引擎
Elastic 中国社区官方博客2 天前
使用 LangExtract 和 Elasticsearch
大数据·人工智能·elasticsearch·搜索引擎·ai·信息可视化·全文检索
u0104058362 天前
电商导购平台的搜索引擎优化:基于Elasticsearch的商品精准推荐系统
elasticsearch·搜索引擎·jenkins
在未来等你2 天前
Elasticsearch面试精讲 Day 16:索引性能优化策略
大数据·分布式·elasticsearch·搜索引擎·面试