AI内容审核系统（简化版实现）

技术栈组合

Python + ERNIE大模型API + OpenCV + 异步处理，适用于中小规模并发场景。大厂实际部署会结合Kafka消息队列和Redis缓存，本示例聚焦核心审核逻辑。

核心实现模块

ERNIE API配置

替换ERNIE_API_KEY为从字节开放平台申请的密钥，文本审核接口地址固定为百度智能云服务端点：

python 复制代码

ERNIE_API_KEY = "your_api_key"
ERNIE_URL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/text_cls/ernie"

违规关键词库

基础关键词过滤作为第一道防线，实际生产环境会动态更新词库：

python 复制代码

ILLEGAL_KEYWORDS = ["违规", "低俗", "暴力", "色情"]

图片违规检测

通过OpenCV计算图像模糊度，模糊图像可能涉及违规内容遮挡：

python 复制代码

def detect_illegal_image(image_path):
    img = cv2.imread(image_path)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    laplacian = cv2.Laplacian(gray, cv2.CV_64F).var()  # 拉普拉斯方差检测
    return laplacian < 50  # 阈值可调

异步文本审核

通过aiohttp实现并发请求ERNIE模型，结合关键词库双重验证：

python 复制代码

async def check_text_illegal(session, text):
    params = {"access_token": ERNIE_API_KEY, "text": text}
    async with session.post(ERNIE_URL, json=params) as response:
        result = await response.json()
        return any(keyword in text for keyword in ILLEGAL_KEYWORDS) 
               or result["results"][0]["name"] == "违规"

生产级优化方向

性能优化

引入Redis缓存已审核内容，减少重复调用
使用Kafka处理峰值流量，实现削峰填谷
图片检测改用异步IO处理（本示例为同步简化版）

功能扩展

增加视频流帧提取审核
建立动态更新的违规样本库
集成多模态模型联合判断

测试用例示范

python 复制代码

if __name__ == "__main__":
    test_texts = ["正常文案", "包含暴力内容"]
    test_images = ["clear.jpg", "blurred.jpg"] 
    asyncio.run(main(test_texts, test_images))

该实现已剥离大厂复杂架构，保留最核心的文本+图片审核流程，适合作为AI落地的第一个完整项目实践。

无关技术高低，只是一份简单的乐趣与回忆。以后有空，或许还能再优化优化，提升一下编程的水平，或是加一点更贴心的小功能，毕竟，热爱从来都不分轻重，随手而为的美好，也值得被记录。收藏点赞关注转发都有积分哦。

点个关注

进入我主页「资源」

免费下载，直接运行

持续分享Python/网页/小程序/电脑实用工具，

不套路、不加密，关注不迷路！