lucene渲染未命中最匹配的关键词和内容

lucene 搜索时未命中匹配度最高的关键语句怎么办

原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。

解决办法:

高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。

java 复制代码
        String highlight_left_temp ="<span style='color:red'>";
        String highlight_right_temp ="</span>";
        //高亮显示
        SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter(highlight_left_temp, highlight_right_temp);
        Highlighter highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
        //高亮后的段落范围在100字内
        Fragmenter fragmenter = new SimpleFragmenter(100);
        highlighter.setTextFragmenter(fragmenter);
        highlighter.setMaxDocCharsToAnalyze(Integer.MAX_VALUE); //关键设置
相关推荐
sniper_fandc6 小时前
Elasticsearch从入门到进阶——搜索引擎原理
大数据·elasticsearch·搜索引擎
LaughingZhu12 小时前
Product Hunt 每日热榜 | 2025-10-26
人工智能·经验分享·搜索引擎·产品运营
0和1的舞者1 天前
《Git:从入门到精通(八)——企业级git开发相关内容》
大数据·开发语言·git·搜索引擎·全文检索·软件工程·初学者
sniper_fandc2 天前
Elasticsearch从入门到进阶——搜索优化原理
elasticsearch·搜索引擎·lucene·1024程序员节
Elastic 中国社区官方博客3 天前
介绍 Elastic 的 Agent Builder - 9.2
大数据·运维·人工智能·elasticsearch·搜索引擎·ai·全文检索
xxxxxxllllllshi3 天前
【Elasticsearch查询DSL API完全指南:从入门到精通】
java·大数据·elasticsearch·搜索引擎·面试·全文检索·jenkins
白帽子凯哥哥3 天前
SpringBoot + Elasticsearch实战:从零构建高性能搜索与数据分析平台
大数据·spring boot·后端·elasticsearch·搜索引擎·性能优化·聚合查询
SEO_juper4 天前
2026 AI可见性:构建未来-proof策略的顶级工具
人工智能·搜索引擎·百度·工具·数字营销
INFINI Labs4 天前
搜索百科(5):Easysearch — 自主可控的国产分布式搜索引擎
elasticsearch·搜索引擎·easysearch·国产替代·搜索百科
像是套了虚弱散4 天前
DevEco Studio与Git完美搭配:鸿蒙开发的版本控制指南
大数据·elasticsearch·搜索引擎