敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义

开源项目

敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin

版本特性

大家好,我是老马。

敏感词一开始了内置了多种检验策略,但是很多用户在使用的过程中希望可以自定义策略。

所以 v0.25.0 开始,支持用户对部分策略进行自定义实现。

快速开始

maven 引入

xml 复制代码
<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>sensitive-word</artifactId>
    <version>0.25.0</version>
</dependency>

配置说明

v0.25.0 目前的几个策略,也支持用户引导类自定义。

所有的策略都是接口,支持用户自定义实现,自己在

序号 方法 说明 默认值
16 wordCheckNum 数字检测策略(v0.25.0开始支持) WordChecks.num()
17 wordCheckEmail 邮箱检测策略(v0.25.0开始支持) WordChecks.email()
18 wordCheckUrl URL检测策略(v0.25.0开始支持),内置还是实现了 urlNoPrefix() (WordChecks.url()
19 wordCheckIpv4 ipv4检测策略(v0.25.0开始支持) WordChecks.ipv4()
20 wordCheckWord 敏感词检测策略(v0.25.0开始支持) WordChecks.word()

内置实现:

a) WordChecks.urlNoPrefix() 作为 url 的额外实现,可以不需要 https://http:// 前缀。

自定义使用的例子

下面是一个简单使用自定义策略的例子

java 复制代码
final String text = "点击链接 https://www.baidu.com 查看答案,当然也可以是 baidu.com、www.baidu.com";
final SensitiveWordBs sensitiveWordBs = SensitiveWordBs.newInstance()
        .enableUrlCheck(true) // 启用URL检测
        .wordCheckUrl(WordChecks.urlNoPrefix()) //指定检测的方式
        .init();
List<String> wordList = sensitiveWordBs.findAll(text);
Assert.assertEquals("[www.baidu.com, baidu.com, www.baidu.com]", wordList.toString());
Assert.assertEquals("点击链接 https://************* 查看答案,当然也可以是 *********、*************", sensitiveWordBs.replace(text));

wordCheckUrl 可以指定对应的策略,如果不满足业务可以自己实现。

小结

希望本文对你有所帮助,如果喜欢,欢迎点赞收藏转发一波。

我是老马,期待与你的下次相遇。

敏感词系列

sensitive-word-admin 敏感词控台 v1.2.0 版本开源

sensitive-word-admin v1.3.0 发布 如何支持分布式部署?

01-开源敏感词工具入门使用

02-如何实现一个敏感词工具?违禁词实现思路梳理

03-敏感词之 StopWord 停止词优化与特殊符号

04-敏感词之字典瘦身

05-敏感词之 DFA 算法(Trie Tree 算法)详解

06-敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果

v0.10.0-脏词分类标签初步支持

v0.11.0-敏感词新特性:忽略无意义的字符,词标签字典

v0.12.0-敏感词/脏词词标签能力进一步增强

v0.13.0-敏感词特性版本发布 支持英文单词全词匹配

v0.16.1-敏感词新特性之字典内存资源释放

v0.19.0-敏感词新特性之敏感词单个编辑,不必重复初始化

v0.20.0 敏感词新特性之数字全部匹配,而不是部分匹配

v0.21.0 敏感词新特性之白名单支持单个编辑,修正白名单包含黑名单时的问题

v0.23.0 敏感词新特性之结果条件拓展,内置支持链式+单词标签

v0.24.0 新特性支持标签分类,内置实现多种策略

相关推荐
無炆_11 分钟前
Cline原理分析-prompt
linux·ai·prompt
说私域12 分钟前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的电商直播流量转化路径研究
人工智能·小程序·开源·零售
人类群星闪耀时14 分钟前
5G与边缘计算:协同发展,开启智慧世界新篇章
人工智能·5g·边缘计算
诸葛务农1 小时前
DeepSeek眼中的文明印记:金刚经
人工智能
AlexandrMisko2 小时前
从0搭建Transformer
人工智能·pytorch·transformer
搏博3 小时前
机器学习之五:基于解释的学习
人工智能·深度学习·学习·算法·机器学习
望获linux3 小时前
北京亦庄机器人马拉松:人机共跑背后的技术突破与产业启示
linux·人工智能·机器人·操作系统·开源软件·rtos·具身智能
Xiaoxiaoxiao02097 小时前
GAEA商业前景和生态系统扩展
人工智能·架构·web3·去中心化·区块链
乌恩大侠7 小时前
【东枫科技】AMD / Xilinx Alveo™ V80计算加速器卡
人工智能·科技·5g·nvidia·6g·usrp
豌豆花下猫8 小时前
Python 潮流周刊#100:有了 f-string,为什么还要 t-string?(摘要)
后端·python·ai