lucene渲染未命中最匹配的关键词和内容

lucene 搜索时未命中匹配度最高的关键语句怎么办

原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。

解决办法:

高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。

java 复制代码
        String highlight_left_temp ="<span style='color:red'>";
        String highlight_right_temp ="</span>";
        //高亮显示
        SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter(highlight_left_temp, highlight_right_temp);
        Highlighter highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
        //高亮后的段落范围在100字内
        Fragmenter fragmenter = new SimpleFragmenter(100);
        highlighter.setTextFragmenter(fragmenter);
        highlighter.setMaxDocCharsToAnalyze(Integer.MAX_VALUE); //关键设置
相关推荐
小园子的小菜5 小时前
Elasticsearch高阶用法实战:从数据建模到集群管控的极致优化
大数据·elasticsearch·搜索引擎
老陈头聊SEO5 小时前
AI与SEO策略结合下的关键词优化新发现
其他·搜索引擎·seo优化
金士镧(厦门)新材料有限公司19 小时前
稀土氧化物:材料科技中的“隐形力量”
科技·安全·全文检索
脑极体1 天前
穿越沙海:中国AI的中东远征
人工智能·搜索引擎
LaughingZhu2 天前
Product Hunt 每日热榜 | 2025-11-14
人工智能·经验分享·搜索引擎·产品运营
liliangcsdn3 天前
如何基于DSL脚本进行elasticsearch向量检索示例
大数据·elasticsearch·搜索引擎
厨 神3 天前
11月10日ES本机
大数据·elasticsearch·搜索引擎
甄心爱学习3 天前
信息检索11-语言模型
数学建模·语言模型·全文检索
Elastic 中国社区官方博客5 天前
Elasticsearch 的结构化文档配置 - 递归分块实践
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jenkins
weisian1515 天前
Elasticsearch-4--倒排索引的原理?
大数据·elasticsearch·搜索引擎