使用springboot实现过滤敏感词功能

一,在springboot项目的resources目录里创建sensitive-words.text(敏感词文本)

每个词独自一行

列如:

赌博

吸毒

开票

二,在util创建工具类SensitiveFilter

js 复制代码
package com.nowcoder.community.util;

@Component
public class SensitiveFilter{

	private static final Logger logger = LoggerFactory.getLogger(SensitiveFilter.class);

	// 替换符
	private static final String REPLACMENT = "***";

	// 根节点
	private TrieNode rootNode = new TrieNode();
	
	@PostConstruct
	public void init(){
		try(
			InputStream is = this.getClass().getClassLoader().getResourceAsStream("sebsitive-words.txt");
			BufferedReader reader = new BufferedReader(new InputStreamReader(is));
		){
			String keyword;
			while((keyword = reader.readLine()) != null){
				// 添加到前缀树
				this.addkeyword(keyword);
			}
		} catch(IOException e){
			logger.error("加载敏感词文件失败:"+ e.getMessage())
		}
	}
	
	// 将一个敏感词添加到前缀树里
	private void addKeyword(String keyword) {	
		TrieNode tempNode = rootNode;
		for(int i = 0; i < keyword.length(); i++ ){
			char c = keyword.charAT(i);
			TrieNode subNode = tempNode.getSubNode(c);

			if(subNode == null){
				// 初始化子节点
				subNode = new TrieNode();
				tempNode.addSubNode(c,subNode);
			}
			
			// 指向子节点,进入下一轮循环
			tempNode = subNode;
			
			// 设置结束标识
			if(i == keyword.length() - 1){
				tempNode.setKeywordEnd(true);
			}
		}
	}
	
	/**
	* 过滤敏感词
	*
	* @param text 待过滤文本
	* @return 过滤后的文本
	*/
	public String filter(String text){
		if(StringUtils.isBlank(text)){
			return null;
		}
		
		// 指针1
		TrieNode tempNode = rootNode;
		// 指针2
		int begin = 0;
		// 指针3
		int position = 0;
		// 结果
		StringBuilder sb = new StringBuilder();
		
		while (position < text.length()){
			char c = text.charAt(position);
			// 跳过符号
			if(isSymbol(c)){
				// 若指针1处于根节点,将此符号计入结果,让指针2向下走一步
				if(tempNode == rootNode){
					sb.appenf(c);
					begin++;
				}
				// 无论符号在开头或中间,指针3都向下走一步
				position++;
				continue;
			}
			
			// 检查下级节点
			tempNode = tempNode.getSubNode(c);
			if(tempNode == null){
				// 以begin开头的字符串不是敏感词
				sb.apped(text.charAt(begin));
				// 进入下一个位置
				position = ++begin;
				// 重新指向根节点
				tempNode = rootNode;
			} else if(tempNode.isKeywordEnd()){
			 	// 发现敏感词,将begin~position字符串替换掉
			 	sb.append(REPLACEMENT);
			 	// 进入下一个位置
			 	begin = ++position;
			}else {
				// 检查下一个字符
				position++;
			}
		}
		// 将最后一批字符计入结果
		sb.append(text.substring(begin));

		return sb.toString();
	}
	
	// 判断是否为符号
	private boolean isSymbol(Character c){
		// 0x2E80 ~ 0x9FFF 是东亚文字范围
		return !Charutils.isAsciiAlphanumeric(c) && (c < 0x2E80 || c > 0x9FFF);
	}
	
	// 前缀树
	private class TrieNode{
		
		// 关键词结束标识
		privte boolean isKeywordEnd = false;
		
		// 子节点(key是下级字符,value是下级节点)
		private Map<Character,TrieNode> subNodes = new HashMap<>();
		
		// get和set方法
		public boolean isKeywordEnd(){
			return isKeywordEnd;
		}
		
		public void setKeywordEnd(boolean keywordEnd){
			isKeywordEnd = keywordEnd;
		}
		
		// 添加子节点
		public void addSubNode(Character c,TrieNode node){
			subNodes.put(c,node);
		}

		// 获取子节点
		public TrieNode getSubNode(Character c){
			return subNodes.get(c);
		}
    }
}

三,创建Sensitive,进行调用

js 复制代码
public class Sensitive {
	@Autowired
	private SensitiveFilter sensitiveFilter;
	
	@Override
	public void SensitiverFilter(String name){
		filter = sensitiveFilter.filter(name);
		System.out.println(filter)
	}
}
相关推荐
用户67570498850234 分钟前
Go 语言里判断字符串为空,90% 的人都写错了!
后端·go
Flittly38 分钟前
【AgentScope Java新手村系列】(16)从RAG到多路检索
java·spring boot·spring
用户67570498850243 分钟前
Go 进阶必修:90% 的人都没用对的“表驱动法”
后端·go
小兔崽子去哪了44 分钟前
Java 生成二维码解决方案
java·后端
苍何1 小时前
懂事的 Agent 已经开始自己看屏幕干活了,效率起飞!
后端
掘金码甲哥1 小时前
1分钟买不了吃亏系列: nginx动态域名解析
后端
神奇小汤圆2 小时前
2026大厂Java岗面试记录:八股+场景+项目+AI,一文讲透快速上岸路径(含答案)
后端
神奇小汤圆2 小时前
我说MySQL每张表最好不超过2000万条数据,面试官让我回去等通知?
后端
HuanYu2 小时前
JDK实现动态代理
后端
袋鱼不重2 小时前
解决 Web 端图片预览与下载颜色不一致的一种工程方案
前端·后端