快手12·22事故原因的合理猜测

终于到了自己擅长的领域,就随便写写图一乐吧

先简单介绍下自己,到目前在大厂做了三年半的安全产品,做了两年直播内容安全产品,对风险防控算是有所了解

风险防控的基本流程算是三步走,定标准,依据标准识别风险,对风险内容&账户进行处罚

其中风险识别的流程绝大多数场景是先过一遍机器审核,机器判断不了的再过一遍人工审核

在内容安全里面,直播比较特别的一点是,直播很难做到先审后发,都是先发后审,就是你直播过程中,发现你可能存在风险行为,再召回进行审核,所以一但出现风险内容,线上用户是可以直接看到的,不存在说先审核内容再让你直播;这也是为什么这次风险集中在直播爆发,短视频存在先审核再发布的机制,可以规避上述风险

在这次的事件里面,怀疑有以下三种可能

1.黑产在夜间,人工审核人力较为不足的节点,通过预先识别好的方案,绕开机器审核,大量进行违规内容的直播,这个时候,由于业务低峰期,人工审核较为不足,加上上述直播场景不能先审后发,就导致线上出现大量风险内容没有人工审核,造成风险外溢

2.黑产攻击了下发处罚的接口,导致无法对违规内容和账号进行处罚,进而导致风险外溢

3.并非黑产主动攻击,而是因为风险内容暴增,导致处罚接口性能出现问题,导致无法处罚

以上三种可能里面,我更倾向于第二种,因为昨天外溢的风险内容是多样的,有色情,也有血腥暴力,不同风险类型会有不同的识别算法和模型,黑产很难同时突破多个防线,要想同时几种风险内容都出现在线上,最大的可能就是处罚出问题了,而故障持续时间这么长,结合今天快手突然开始大量招聘网络安全工程师,我会更加怀疑是内部系统被攻击了

那有什么方法可以尽可能减少这种风险呢,我们风险防控会分为三步走,事前事中事后,然后可以针对四类主体做管控(自然人,设备,账号,内容),在这个场景里面,其实我们事前可以做很多,最直接的就是识别到容易发布不良内容的风险账户,前置不允许直播或者提升开播门槛;举几个例子,我们可以要求注册x天内账户开播前必须人脸认证,也可以回收x天不活跃账户的直播权限,必须在平台有一定的活跃行为后才允许直播,也可以识别客户端行为,检测到录播的中断直播/减少推流;本质上增加黑产的作恶成本,就能解决绝大多数黑产问题,因为黑产也不是傻子,不会亏钱,让他们作恶成本变大,赚不到钱,自然就不会作恶了;在事前能做的管控其实很多,不要什么都留到事中来做,事中对系统性能和时效要求就非常高了

当然,放在事前来做会有一个问题,就是一定会有人因为你对他进行直播拦截了,就不直播了,肯定会对业务核心数据有少许影响,那到底是保风险还是保KPI,那就仁者见仁智者见智了

相关推荐
Csvn11 小时前
OpenSpec 详细使用教程
前端
明月_清风11 小时前
加密解密系统完全指南:原理剖析与 Go 实践
后端
之歆12 小时前
Day19_LESS 完全指南——从入门到工程实践
前端·css·less
小江的记录本12 小时前
【JVM虚拟机】垃圾回收GC:垃圾收集器:CMS:核心原理、回收流程、优缺点、废弃原因(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·spring·面试·maven
云水一下13 小时前
HTML5 从入门到精通:实战收官——从零搭建完整静态网站,综合运用所有知识
前端·html5
不总是13 小时前
Windows 系统 Node.js 免安装版(zip)安装与配置教程(2026 最新)
前端·windows·node.js
冬奇Lab13 小时前
每日一个开源项目(第105篇):Twenty - 跳出 Salesforce 的圈套,定义现代开源 CRM
前端·后端·开源
zhangyao94033014 小时前
开发pc端时,表格的高度怎么设置才能铺满页面
前端·javascript·elementui
ServBay14 小时前
月之暗面 Kimi Code 0.4.0 发布,终端 AI 编码助手全面采用 TypeScript,实现毫秒级启动
后端·aigc·ai编程
小江的记录本14 小时前
【JVM虚拟机】垃圾回收GC:垃圾回收算法:标记-清除、标记-复制、标记-整理、分代收集(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·算法·安全·面试