lucene渲染未命中最匹配的关键词和内容

lucene 搜索时未命中匹配度最高的关键语句怎么办

原因:默认的最大分词或者分析字符为51200个,当内容超过这个值时,后面的内容将不会被分析和匹配。

解决办法:

高亮显示设置更大的maxDocCharsToAnalyze 值,需要覆盖大文本的全文内容,这样才能保证命中最准确的语句或者关键词。

java 复制代码
        String highlight_left_temp ="<span style='color:red'>";
        String highlight_right_temp ="</span>";
        //高亮显示
        SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter(highlight_left_temp, highlight_right_temp);
        Highlighter highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
        //高亮后的段落范围在100字内
        Fragmenter fragmenter = new SimpleFragmenter(100);
        highlighter.setTextFragmenter(fragmenter);
        highlighter.setMaxDocCharsToAnalyze(Integer.MAX_VALUE); //关键设置
相关推荐
老陈头聊SEO14 小时前
AI技术赋能SEO关键词优化的最新实践与前景分析
其他·搜索引擎·seo优化
铭毅天下16 小时前
Elasticsearch 9.X 官方文档大变样了!
大数据·elasticsearch·搜索引擎·全文检索
摇滚侠16 小时前
ElasticSearch 是什么,ES 是什么?
大数据·elasticsearch·搜索引擎
老陈头聊SEO1 天前
生成引擎优化(GEO)赋能数字内容战略与网络传播效果提升
其他·搜索引擎·seo优化
垦***耪1 天前
真空泵控制程序真空泵运行控制程序,使用西门子200smart PLC和昆仑通态触摸屏
全文检索
啊吧怪不啊吧1 天前
C++之基于正倒排索引的Boost搜索引擎项目searcher部分代码及详解
c++·搜索引擎·项目
TinpeaV1 天前
Elasticsearch8(ES)保姆级菜鸟入门教程
大数据·spring boot·elasticsearch·搜索引擎·全文检索·postman
Wang's Blog1 天前
Elastic Stack梳理:Logstash持久化队列与高可靠数据处理架构深度解析
搜索引擎·架构·elastic search
Wang's Blog1 天前
Elastic Stack梳理: 数据重建建模与集群优化终极指南
搜索引擎·架构·elastic search
Elastic 中国社区官方博客2 天前
使用 LangGraph.js 和 Elasticsearch 构建一个金融 AI 搜索工作流
大数据·人工智能·elasticsearch·搜索引擎·ai·金融·全文检索