使用springboot实现过滤敏感词功能

一,在springboot项目的resources目录里创建sensitive-words.text(敏感词文本)

每个词独自一行

列如:

赌博

吸毒

开票

二,在util创建工具类SensitiveFilter

js 复制代码
package com.nowcoder.community.util;

@Component
public class SensitiveFilter{

	private static final Logger logger = LoggerFactory.getLogger(SensitiveFilter.class);

	// 替换符
	private static final String REPLACMENT = "***";

	// 根节点
	private TrieNode rootNode = new TrieNode();
	
	@PostConstruct
	public void init(){
		try(
			InputStream is = this.getClass().getClassLoader().getResourceAsStream("sebsitive-words.txt");
			BufferedReader reader = new BufferedReader(new InputStreamReader(is));
		){
			String keyword;
			while((keyword = reader.readLine()) != null){
				// 添加到前缀树
				this.addkeyword(keyword);
			}
		} catch(IOException e){
			logger.error("加载敏感词文件失败:"+ e.getMessage())
		}
	}
	
	// 将一个敏感词添加到前缀树里
	private void addKeyword(String keyword) {	
		TrieNode tempNode = rootNode;
		for(int i = 0; i < keyword.length(); i++ ){
			char c = keyword.charAT(i);
			TrieNode subNode = tempNode.getSubNode(c);

			if(subNode == null){
				// 初始化子节点
				subNode = new TrieNode();
				tempNode.addSubNode(c,subNode);
			}
			
			// 指向子节点,进入下一轮循环
			tempNode = subNode;
			
			// 设置结束标识
			if(i == keyword.length() - 1){
				tempNode.setKeywordEnd(true);
			}
		}
	}
	
	/**
	* 过滤敏感词
	*
	* @param text 待过滤文本
	* @return 过滤后的文本
	*/
	public String filter(String text){
		if(StringUtils.isBlank(text)){
			return null;
		}
		
		// 指针1
		TrieNode tempNode = rootNode;
		// 指针2
		int begin = 0;
		// 指针3
		int position = 0;
		// 结果
		StringBuilder sb = new StringBuilder();
		
		while (position < text.length()){
			char c = text.charAt(position);
			// 跳过符号
			if(isSymbol(c)){
				// 若指针1处于根节点,将此符号计入结果,让指针2向下走一步
				if(tempNode == rootNode){
					sb.appenf(c);
					begin++;
				}
				// 无论符号在开头或中间,指针3都向下走一步
				position++;
				continue;
			}
			
			// 检查下级节点
			tempNode = tempNode.getSubNode(c);
			if(tempNode == null){
				// 以begin开头的字符串不是敏感词
				sb.apped(text.charAt(begin));
				// 进入下一个位置
				position = ++begin;
				// 重新指向根节点
				tempNode = rootNode;
			} else if(tempNode.isKeywordEnd()){
			 	// 发现敏感词,将begin~position字符串替换掉
			 	sb.append(REPLACEMENT);
			 	// 进入下一个位置
			 	begin = ++position;
			}else {
				// 检查下一个字符
				position++;
			}
		}
		// 将最后一批字符计入结果
		sb.append(text.substring(begin));

		return sb.toString();
	}
	
	// 判断是否为符号
	private boolean isSymbol(Character c){
		// 0x2E80 ~ 0x9FFF 是东亚文字范围
		return !Charutils.isAsciiAlphanumeric(c) && (c < 0x2E80 || c > 0x9FFF);
	}
	
	// 前缀树
	private class TrieNode{
		
		// 关键词结束标识
		privte boolean isKeywordEnd = false;
		
		// 子节点(key是下级字符,value是下级节点)
		private Map<Character,TrieNode> subNodes = new HashMap<>();
		
		// get和set方法
		public boolean isKeywordEnd(){
			return isKeywordEnd;
		}
		
		public void setKeywordEnd(boolean keywordEnd){
			isKeywordEnd = keywordEnd;
		}
		
		// 添加子节点
		public void addSubNode(Character c,TrieNode node){
			subNodes.put(c,node);
		}

		// 获取子节点
		public TrieNode getSubNode(Character c){
			return subNodes.get(c);
		}
    }
}

三,创建Sensitive,进行调用

js 复制代码
public class Sensitive {
	@Autowired
	private SensitiveFilter sensitiveFilter;
	
	@Override
	public void SensitiverFilter(String name){
		filter = sensitiveFilter.filter(name);
		System.out.println(filter)
	}
}
相关推荐
swipe4 分钟前
从本地开发到生产部署:用 Docker Compose 跑通 NestJS、MySQL 与 Milvus
后端·langchain·llm
码事漫谈7 分钟前
SenseNova Skills Studio:为商汤SenseNova U1打造的本地办公技能包
后端
zhangxingchao22 分钟前
AI应用开发七:可以替代 RAG 的技术
前端·人工智能·后端
Java面试题总结38 分钟前
java高频面试题(2026最新)
java·开发语言·jvm·数据库·spring·缓存
苦逼的猿宝1 小时前
学生心理咨询评估系统
java·毕业设计·springboot·计算机毕业设计
隔窗听雨眠1 小时前
doctype、charset、meta如何控制整个渲染流水线
java·服务器·前端
牧羊狼的狼1 小时前
浅谈电商下单微服务流程
spring·spring cloud·微服务
excel1 小时前
🧠 Prisma 表名大写 vs SQL 导出小写问题深度解析(附踩坑与解决方案)
前端·后端
GetcharZp2 小时前
Hermes Agent:一个真正“会成长”的开源 AI Agent,正在改变 AI 自动化玩法
后端
西安邮电大学2 小时前
SpringBean完整生命周期
java·spring