敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义

开源项目

敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin

版本特性

大家好,我是老马。

敏感词一开始了内置了多种检验策略,但是很多用户在使用的过程中希望可以自定义策略。

所以 v0.25.0 开始,支持用户对部分策略进行自定义实现。

快速开始

maven 引入

xml 复制代码
<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>sensitive-word</artifactId>
    <version>0.25.0</version>
</dependency>

配置说明

v0.25.0 目前的几个策略,也支持用户引导类自定义。

所有的策略都是接口,支持用户自定义实现,自己在

序号 方法 说明 默认值
16 wordCheckNum 数字检测策略(v0.25.0开始支持) WordChecks.num()
17 wordCheckEmail 邮箱检测策略(v0.25.0开始支持) WordChecks.email()
18 wordCheckUrl URL检测策略(v0.25.0开始支持),内置还是实现了 urlNoPrefix() (WordChecks.url()
19 wordCheckIpv4 ipv4检测策略(v0.25.0开始支持) WordChecks.ipv4()
20 wordCheckWord 敏感词检测策略(v0.25.0开始支持) WordChecks.word()

内置实现:

a) WordChecks.urlNoPrefix() 作为 url 的额外实现,可以不需要 https://http:// 前缀。

自定义使用的例子

下面是一个简单使用自定义策略的例子

java 复制代码
final String text = "点击链接 https://www.baidu.com 查看答案,当然也可以是 baidu.com、www.baidu.com";
final SensitiveWordBs sensitiveWordBs = SensitiveWordBs.newInstance()
        .enableUrlCheck(true) // 启用URL检测
        .wordCheckUrl(WordChecks.urlNoPrefix()) //指定检测的方式
        .init();
List<String> wordList = sensitiveWordBs.findAll(text);
Assert.assertEquals("[www.baidu.com, baidu.com, www.baidu.com]", wordList.toString());
Assert.assertEquals("点击链接 https://************* 查看答案,当然也可以是 *********、*************", sensitiveWordBs.replace(text));

wordCheckUrl 可以指定对应的策略,如果不满足业务可以自己实现。

小结

希望本文对你有所帮助,如果喜欢,欢迎点赞收藏转发一波。

我是老马,期待与你的下次相遇。

敏感词系列

sensitive-word-admin 敏感词控台 v1.2.0 版本开源

sensitive-word-admin v1.3.0 发布 如何支持分布式部署?

01-开源敏感词工具入门使用

02-如何实现一个敏感词工具?违禁词实现思路梳理

03-敏感词之 StopWord 停止词优化与特殊符号

04-敏感词之字典瘦身

05-敏感词之 DFA 算法(Trie Tree 算法)详解

06-敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果

v0.10.0-脏词分类标签初步支持

v0.11.0-敏感词新特性:忽略无意义的字符,词标签字典

v0.12.0-敏感词/脏词词标签能力进一步增强

v0.13.0-敏感词特性版本发布 支持英文单词全词匹配

v0.16.1-敏感词新特性之字典内存资源释放

v0.19.0-敏感词新特性之敏感词单个编辑,不必重复初始化

v0.20.0 敏感词新特性之数字全部匹配,而不是部分匹配

v0.21.0 敏感词新特性之白名单支持单个编辑,修正白名单包含黑名单时的问题

v0.23.0 敏感词新特性之结果条件拓展,内置支持链式+单词标签

v0.24.0 新特性支持标签分类,内置实现多种策略

相关推荐
Ai墨芯1116 分钟前
深度学习水论文:特征提取
人工智能·深度学习
无名工程师13 分钟前
神经网络知识讨论
人工智能·神经网络
nbsaas-boot19 分钟前
AI时代,我们更需要自己的开发方式与平台
人工智能
SHIPKING39323 分钟前
【机器学习&深度学习】LLamaFactory微调效果与vllm部署效果不一致如何解决
人工智能·深度学习·机器学习
jonyleek2 小时前
如何搭建一套安全的,企业级本地AI专属知识库系统?从安装系统到构建知识体系,全流程!
人工智能·安全
MQ_SOFTWARE2 小时前
AI驱动的金融推理:Fin-R1模型如何重塑行业决策逻辑
人工智能·金融
生医转码,四海为家3 小时前
零基础-动手学深度学习-6.6 卷积神经网络(LeNet)
人工智能·深度学习·cnn
无名工程师3 小时前
AI 学习过程中各阶段的学习重点、时间规划以及不同方向的选择与建议等内容
人工智能·学习
WXX_s3 小时前
【OpenCV篇】OpenCV——03day.图像预处理(2)
人工智能·python·opencv·学习·计算机视觉