私有化敏感词检测API服务wordscheck

之前有网友在找敏感词检测的应用,这个应该能满足他的需求;

什么是 wordscheck ?

wordscheck 是敏感词检测 API,提供文本识别、智能鉴黄、涉政检测、谩骂等等敏感词检测过滤服务。

简介

  • 敏感词库从大量样本库整理出来,基于 NLP 算法检测
  • 支持 WindowsMacOSLinux64 位主流系统
  • 可以部署在本地,或部署到阿里云、腾讯云、亚马逊云、谷歌云等云服务器
  • 通过下载部署包,即可一键启动私有化的"敏感词检测 API 服务"
  • 支持自动云更新最新词库
  • 支持 http json方式或 gRPC 方式查询
  • 单服务参考查询效率 70000 次/分钟,同时支持并行服务
  • 支持自定义添加白名单/黑名单词条
  • 服务运行内存 100M 左右,非常轻便

应用场景

  • AI 智能问答、评论留言、聊天消息、直播弹幕、商品详情 等内容合规检测过滤
  • 应用提审上架、主管部门审核、云平台内容巡查 等监管需要
  • 境内外 产品内容合规需要,可部署到中国香港、新加坡、日本、美国、韩国等

构建镜像

如果你不想自己构建,可以跳过,直接阅读下一章节

官方提供了 Dockerfile 文件,但没找到镜像,所以需要编自己编一下

构建镜像和容器运行的基本命令如下👇

bash 复制代码
# 下载代码
git clone https://github.com/bosnzt/wordscheck.git
  
# 或者加个代理
git clone https://ghproxy.com/github.com/bosnzt/wordscheck.git
  
# 进入目录  
cd wordscheck
  
# 构建镜像
docker build -t wbsu2003/wordscheck:v1 .

# 运行容器
docker run -d \
   --name wordscheck \
   -p 8187:8080 \
   wbsu2003/wordscheck:v1

安装

在群晖上以 Docker 方式安装。

在注册表中搜索 wordscheck ,选择第一个 wbsu2003/wordscheck,版本选择 latest

端口

本地端口不冲突就行,不确定的话可以用命令查一下

bash 复制代码
# 查看端口占用
netstat -tunlp | grep 端口号
本地端口 容器端口
8187 8080

默认没有暴露端口

需要点 + 号自己添加

命令行安装

如果你熟悉命令行,可能用 docker cli 更快捷

bash 复制代码
# 运行容器
docker run -d \
   --restart unless-stopped \
   --name wordscheck \
   -p 8187:8080 \
   wbsu2003/wordscheck

也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件

yaml 复制代码
version: '3'

services:
  wordscheck:
    image: wbsu2003/wordscheck
    container_name: wordscheck
    restart: unless-stopped
    ports:
      - 8187:8080

然后执行下面的命令

bash 复制代码
# 新建文件夹 wordscheck
mkdir -p /volume1/docker/wordscheck

# 进入 wordscheck 目录
cd /volume1/docker/wordscheck

# 将 docker-compose.yml 放入当前目录

# 一键启动
docker-compose up -d

运行

容器启动后,在日志中会看到

但是如果你直接在浏览器中输入 http://群晖IP:8187 ,会看到下面的错误

log 复制代码
404 page not found

需要通过 curl 来验证,用 SSH 客户端登录到群晖后,在命令行执行

bash 复制代码
curl http://192.168.0.197:8187/health

如果状态正常,会返回

json 复制代码
{"code":"0"}

测试下敏感词服务

bash 复制代码
curl -H "Accept: application/json" \
     -H "Content-type: application/json" \
     -X POST \
     -d "{\"content\":\"他在传播艳情内容\"}"  \
     http://192.168.0.197:8187/wordscheck

在输出格式化之后是👇下面这样的

json 复制代码
{  
    "code":"0",  
    "msg":"检测成功",  
    "return_str":"他在传播**内容",  
    "word_list":[  
        {  
            "keyword":"艳情",  
            "category":"色情",  
            "position":"4-5",  
            "level":"高"  
        }  
    ],  
    "extstr":""  
}

如果觉得 curl 不方便,可以试试 api 工具

官方提供了 httprpc 的不同语言的调用示例,需要自己根据需要进行选择

参考文档

bosnzt/wordscheck: 敏感词检测,违禁词过滤,敏感词过滤,敏感词库,一键启动,本地运行,私有化部署,1分钟接入完成,支持docker,支持在线api

地址:https://github.com/bosnzt/wordscheck
介绍 - Powered by MinDoc

地址:https://doc.wordscheck.com/docs/docs
文本识别_智能鉴黄_敏感词过滤_涉政检测_在线体验_wordscheck

地址:https://www.wordscheck.com/

相关推荐
@泽栖5 小时前
Docker 常用命令
运维·服务器·docker
鲁正杰7 小时前
在一个服务器上抓取 Docker 镜像并在另一个服务器上运行
运维·服务器·docker
老大白菜8 小时前
Windows 11 安装 Dify 完整指南 非docker环境
windows·docker·容器
VinciYan11 小时前
基于Jenkins+Docker的自动化部署实践——整合Git与Python脚本实现远程部署
python·ubuntu·docker·自动化·jenkins·.net·运维开发
tntlbb12 小时前
Ubuntu20.4 VPN+Docker代理配置
运维·ubuntu·docker·容器
Gabriel_liao12 小时前
Docker安装Neo4j
docker·容器·neo4j
豆豆豆豆变15 小时前
Docker轻量级可视化工具Portainer
docker·容器·自动化运维
大熊程序猿16 小时前
xxl-job docker 安装
运维·docker·容器
shelby_loo16 小时前
使用 Docker 在 Ubuntu 下部署 Cloudflared Tunnel 服务器
服务器·ubuntu·docker
咏颜17 小时前
Ubuntu离线安装Docker容器
linux·运维·服务器·经验分享·ubuntu·docker