lucene渲染未命中最匹配的关键词和内容

lucene 搜索时未命中匹配度最高的关键语句怎么办

原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。

解决办法:

高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。

java 复制代码
        String highlight_left_temp ="<span style='color:red'>";
        String highlight_right_temp ="</span>";
        //高亮显示
        SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter(highlight_left_temp, highlight_right_temp);
        Highlighter highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
        //高亮后的段落范围在100字内
        Fragmenter fragmenter = new SimpleFragmenter(100);
        highlighter.setTextFragmenter(fragmenter);
        highlighter.setMaxDocCharsToAnalyze(Integer.MAX_VALUE); //关键设置
相关推荐
爱敲代码的憨仔17 小时前
Elasticsearch入门
大数据·elasticsearch·搜索引擎
G皮T17 小时前
【Elasticsearch】审计日志(一):General settings
大数据·elasticsearch·搜索引擎·全文检索·kibana·审计·审计日志
G皮T18 小时前
【Elasticsearch】审计日志(二):Compliance settings(合规性审计设置)
大数据·elasticsearch·搜索引擎·全文检索·kibana·审计·审计日志
ZI Keep Going19 小时前
前来填坑:Search Around the World全球联合部署搜索引擎
前端·javascript·搜索引擎
G皮T19 小时前
【Elasticsearch】审计日志(三):案例实战分析
大数据·elasticsearch·搜索引擎·全文检索·kibana·opensearch·审计日志
highly20092 天前
Gitflow
大数据·elasticsearch·搜索引擎
LaughingZhu2 天前
Product Hunt 每日热榜 | 2026-01-18
大数据·人工智能·经验分享·搜索引擎·产品运营
海绵宝宝de派小星2 天前
AI发展简史与里程碑事件
人工智能·搜索引擎
老陈头聊SEO2 天前
生成引擎优化(GEO)助力内容创作新风向与用户互动提升
其他·搜索引擎·seo优化
傻傻水2 天前
数字人平台哪家好:权威排名深度解析
科技·物联网·搜索引擎