敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义

开源项目

敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin

版本特性

大家好,我是老马。

敏感词一开始了内置了多种检验策略,但是很多用户在使用的过程中希望可以自定义策略。

所以 v0.25.0 开始,支持用户对部分策略进行自定义实现。

快速开始

maven 引入

xml 复制代码
<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>sensitive-word</artifactId>
    <version>0.25.0</version>
</dependency>

配置说明

v0.25.0 目前的几个策略,也支持用户引导类自定义。

所有的策略都是接口,支持用户自定义实现,自己在

序号 方法 说明 默认值
16 wordCheckNum 数字检测策略(v0.25.0开始支持) WordChecks.num()
17 wordCheckEmail 邮箱检测策略(v0.25.0开始支持) WordChecks.email()
18 wordCheckUrl URL检测策略(v0.25.0开始支持),内置还是实现了 urlNoPrefix() (WordChecks.url()
19 wordCheckIpv4 ipv4检测策略(v0.25.0开始支持) WordChecks.ipv4()
20 wordCheckWord 敏感词检测策略(v0.25.0开始支持) WordChecks.word()

内置实现:

a) WordChecks.urlNoPrefix() 作为 url 的额外实现,可以不需要 https://http:// 前缀。

自定义使用的例子

下面是一个简单使用自定义策略的例子

java 复制代码
final String text = "点击链接 https://www.baidu.com 查看答案,当然也可以是 baidu.com、www.baidu.com";
final SensitiveWordBs sensitiveWordBs = SensitiveWordBs.newInstance()
        .enableUrlCheck(true) // 启用URL检测
        .wordCheckUrl(WordChecks.urlNoPrefix()) //指定检测的方式
        .init();
List<String> wordList = sensitiveWordBs.findAll(text);
Assert.assertEquals("[www.baidu.com, baidu.com, www.baidu.com]", wordList.toString());
Assert.assertEquals("点击链接 https://************* 查看答案,当然也可以是 *********、*************", sensitiveWordBs.replace(text));

wordCheckUrl 可以指定对应的策略,如果不满足业务可以自己实现。

小结

希望本文对你有所帮助,如果喜欢,欢迎点赞收藏转发一波。

我是老马,期待与你的下次相遇。

敏感词系列

sensitive-word-admin 敏感词控台 v1.2.0 版本开源

sensitive-word-admin v1.3.0 发布 如何支持分布式部署?

01-开源敏感词工具入门使用

02-如何实现一个敏感词工具?违禁词实现思路梳理

03-敏感词之 StopWord 停止词优化与特殊符号

04-敏感词之字典瘦身

05-敏感词之 DFA 算法(Trie Tree 算法)详解

06-敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果

v0.10.0-脏词分类标签初步支持

v0.11.0-敏感词新特性:忽略无意义的字符,词标签字典

v0.12.0-敏感词/脏词词标签能力进一步增强

v0.13.0-敏感词特性版本发布 支持英文单词全词匹配

v0.16.1-敏感词新特性之字典内存资源释放

v0.19.0-敏感词新特性之敏感词单个编辑,不必重复初始化

v0.20.0 敏感词新特性之数字全部匹配,而不是部分匹配

v0.21.0 敏感词新特性之白名单支持单个编辑,修正白名单包含黑名单时的问题

v0.23.0 敏感词新特性之结果条件拓展,内置支持链式+单词标签

v0.24.0 新特性支持标签分类,内置实现多种策略

相关推荐
FrontAI2 分钟前
深入浅出 LangGraph —— 第11章:子图:构建模块化Agent
人工智能·langchain·ai agent·langgraph
njsgcs5 分钟前
我有待做任务清单和不良操作图片集,如何设计ai agent协助我完成工作
大数据·人工智能
AI科技星7 分钟前
《全域数学》第三卷:代数原本 · 全书详述【乖乖数学】
开发语言·人工智能·机器学习·数学建模
AI进化营-智能译站12 分钟前
ROS2 C++开发系列13-运算符重载让ROS2消息处理更自然
java·开发语言·c++·ai
AI科技星12 分钟前
《全域数学》第一部 数术本源 第三卷 代数原本第14篇 附录二 猜想证明【乖乖数学】
人工智能·算法·数学建模·数据挖掘·量子计算
XD74297163612 分钟前
科技早报|2026年5月2日:AI 编程工具开始按用量收费
人工智能·科技·ai编程·github copilot·科技早报
liangdabiao13 分钟前
乐高摩托车深度报告-致敬张雪夺冠 -基于llm-wiki技术自动化写文章的效果
运维·人工智能·自动化
KC27015 分钟前
Prompt 注入攻击的 5 种姿势和防御指南
人工智能
翔云12345615 分钟前
大模型训练框架全景解析(2026最新)
ai·大模型
不懒不懒18 分钟前
【从零入门本地大模型:Ollama 安装部署 + Qwen2.5 实现零样本情感分类】
人工智能·分类·数据挖掘·大模型·ollama