前言
在上篇文章《Java项目中实现敏感词过滤功能》中为了避免每次过滤敏感词都要查询数据库加载敏感词库,笔者设计将敏感词库缓存到了Redis中,缓存时间5分钟。
在后续开发联调中,敏感词过滤逻辑报错:类型转换错误,无法将HashSet转为String类型。
关键代码如下:
scss
/**
* 从数据库或缓存加载敏感词库,默认缓存5min
* @return
*/
private Set<String> getSensitiveWords() {
if(redisTemplate.hasKey(SENSITIVE_WORDS_KEY)) {
return redisTemplate.opsForSet().members(SENSITIVE_WORDS_KEY);
}
Set<String> sensitiveWords = new HashSet<>();
try {
R<List<SysDictItem>> r = dictService.getDictByType("sensitive_words");
if(CommonConstants.SUCCESS.equals(r.getCode())) {
sensitiveWords = r.getData().stream().map(SysDictItem::getItemValue).collect(Collectors.toSet());
redisTemplate.opsForSet().add(SENSITIVE_WORDS_KEY, sensitiveWords);
redisTemplate.expire(SENSITIVE_WORDS_KEY, 5, TimeUnit.MINUTES);
}
} catch (Exception e) {
log.warn("远程获取敏感词信息失败!", e);
}
return sensitiveWords;
}
// 具体过滤逻辑代码
Set<String> sensitiveWords = getSensitiveWords();
// 自定义敏感词作为第三方敏感词服务的补充,词库数量应该不会很大,因此检验方式比较简单粗暴
if(sensitiveWords.stream().anyMatch(word -> text.contains(word))) return Boolean.FALSE;
问题分析与解决
笔者原意调用redisTemplate.opsForSet().add(SENSITIVE_WORDS_KEY, sensitiveWords)
,将敏感词集合写入Redis缓存,然后通过调用redisTemplate.opsForSet().members(SENSITIVE_WORDS_KEY)
从Redis中获取缓存的敏感词集合Set,但实际情况这里获取到类型不是Set,而是Set,以至于后续调用代码sensitiveWords.stream().anyMatch(word -> text.contains(word))
匹配校验时,报错:类型转换异常。
为什么会这样呢?笔者仔细研究了SetOperations.add(K key, V... values)
方法,源码如下:
scss
public Long add(K key, V... values) {
byte[] rawKey = rawKey(key);
byte[][] rawValues = rawValues((Object[]) values);
return execute(connection -> connection.sAdd(rawKey, rawValues));
}
原来该方法会将values参数自动转换为Object[],由于笔者代码中传递的是一个Set对象,因此实际存入Redis中的是一个包含1个Set类型元素的数组,所以当笔者通过members方法获取之后使用时出现类型异常。
处理方法也很简单:只需要将Set转换为数组即可。代码如下:
scss
redisTemplate.opsForSet().add(SENSITIVE_WORDS_KEY, sensitiveWords.toArray());