腾讯云国际站WAF：如何在腾讯云WAF上设置CC攻击防护，以保障业务数据免被恶意爬取？

在腾讯云 WAF 上设置 CC 攻击防护，以保障业务数据免被恶意爬取，主要是在CC 防护设置 或自定义防护策略 中，通过限制访问频率 和采用人机识别等手段来实现。

以下是具体的配置步骤和关键点：

CC 攻击（Challenge Collapsar）和恶意爬取都是通过高频访问消耗服务器资源或获取数据。WAF 的目标是限制这种高频访问并强制机器进行身份验证。

这是最基础且常用的防护方式，用于拦截来自单个 IP 的高频请求。

在 CC 防护 页面，点击 添加规则。
规则名称： 填写一个易于识别的名称（如："高频访问拦截"）。
识别模式： 选择 IP（以访问源 IP 地址作为限速维度）。
匹配条件（URL/路径）：
- 匹配 URL： 填写您希望重点保护的业务接口或页面路径（例如 /api/productlist 或 /detail/*）。如果不填写，则默认对该域名的所有请求生效。
- 匹配条件： 选择相等、前缀匹配 或包含等。
访问频次（关键设置）：
- 根据您网站正常用户的平均访问速度设置一个合理的阈值。
- 建议： 设置为正常访问速度的3到10倍。例如，如果正常用户1分钟内访问20次，您可以配置为60次/1分钟。
执行动作：
- 人机识别（推荐）： 触发阈值后，强制访问者进行验证码、滑动验证等验证。这能有效拦截恶意爬虫脚本，同时避免误伤正常用户。
- 阻断（更严格）： 触发阈值后，直接返回拦截页面。
惩罚时长： 设置阻断或人机识别的持续时间（例如5分钟、1小时）。
优先级： 数字越小，优先级越高。

如果您的用户使用同一出口 IP（如公司网络或公共 Wi-Fi），基于 IP 的限速容易误伤。此时应使用基于 SESSION 或其他标识的限速。

设置 SESSION 维度：
- 在 CC 防护设置中，找到 SESSION 设置。
- 您可以选择 COOKIE 、GET 或 POST 中的某个参数作为用户标识（例如，用一个包含用户登录信息的 Cookie 值来识别用户会话）。
- 设置匹配位置和标识符，确保 WAF 能准确提取到唯一的会话标识。
创建 SESSION 规则：
- 识别模式： 选择 SESSION。
- 其余配置（匹配条件、访问频次、执行动作）与基于 IP 的规则类似。这将确保即使是共享 IP 的多用户，也能基于各自的 SESSION 独立限速。

虽然 CC 防护可以防御高频爬取，但专业的爬虫防御通常在 Bot 管理模块中实现。

通过以上步骤，您可以为您的业务建立多层次的 CC 攻击和恶意爬取防护体系。