817个安全技能,6个框架,26+平台兼容:Anthropic正在用AI重写网络安全规则

817个安全技能,6个框架,26+平台兼容:Anthropic正在用AI重写网络安全规则

ISC2的数据摆在那:2024年全球网络安全人才缺口480万个空缺职位。这个数字我反复看了几遍,不是48万,是480万。与此同时,AI Agent的代码能力已经强到可以独立完成漏洞分析、日志取证、甚至红队渗透的部分流程。

一边是人不够用,一边是机器越来越能干。Anthropic社区开发者Mahipal Jangra(@mukul975)做了一件事:把817个生产级网络安全技能打包成AI Agent可以直接调用的标准格式,开源在GitHub上。Apache License 2.0,随便用。

项目名叫Anthropic-Cybersecurity-Skills,但得说清楚:这是一个独立社区项目,和Anthropic PBC没有官方关联。用Anthropic的名字,更多是因为这些技能最初面向Claude生态设计,现在已扩展到26+个AI平台。

817个技能,29个领域:到底有什么

先看规模。817个技能,覆盖29个安全领域,分类很细,每个技能都是可执行的操作手册。我挑几个重点领域拆开说。

云安全(66个技能) 是数量最多的领域。覆盖AWS、Azure、GCP三大云的加固配置、CSPM(云安全态势管理)、云端攻击模拟和云取证。如果你做过云安全合规,就知道CIS Benchmark的检查项有多碎,人工过一遍几百条规则要花一整天。这些技能把检查逻辑结构化后,AI Agent可以批量扫描、生成报告、甚至自动修复部分配置。

威胁猎捕(58个技能) 偏实战。假设驱动猎捕、LOTL(Living Off The Land)检测、EVTX日志猎捕,这些是SOC分析师每天打交道的东西。技能里包含具体的检测规则、查询语句和验证方法,不是教科书概念。

威胁情报(52个技能) 对接STIX/TAXII、MISP、OpenCTI这些主流情报平台,覆盖情报的生产、消费、共享全流程。

数字取证(41个技能) 这块我特别关注。磁盘镜像、内存取证、时间线分析,技能里集成了Hayabusa、KAPE、Plaso这些取证圈的标准工具链。做过取证的人知道,时间线重建是最耗时的环节,Plaso跑一个500GB的镜像可能要几个小时。如果AI Agent能自动化预处理、筛选关键时间窗口,效率提升是实打实的。

红队(33个技能) 包含ADCS/Certipy、BloodHound CE、Sliver/Havoc C2。这些工具在红队演练里几乎是标配。技能把它们的使用流程结构化,AI Agent可以根据目标环境自动选择攻击路径。

完整领域列表我列个表,大家感受一下覆盖面:

排名 领域 技能数 核心能力
1 Cloud Security(云安全) 66 AWS/Azure/GCP加固、CSPM、攻击模拟
2 Threat Hunting(威胁猎捕) 58 假设驱动猎捕、LOTL检测、EVTX猎捕
3 Threat Intelligence(威胁情报) 52 STIX/TAXII、MISP、OpenCTI
4 Network Security(网络安全) 43 IDS/IPS、防火墙规则、VLAN分段
5 Web Application Security(Web应用安全) 42 OWASP Top 10、SQLi、XSS、SSRF
6 Digital Forensics(数字取证) 41 磁盘镜像、内存取证、时间线分析
7 Malware Analysis(恶意软件分析) 39 静态/动态分析、逆向工程
8 Identity & Access Management 37 Entra ID/ROADtools、零信任
9 SOC Operations(SOC运营) 35 剧本、升级工作流
10 Red Teaming(红队) 33 ADCS/Certipy、BloodHound CE、C2框架

还有19个领域没有全部列出,但有两个值得单独提。AI安全(14个技能) 覆盖LLM红队测试(garak/PyRIT)、提示注入检测、MCP/Agentic安全,这是当下最热的方向。供应链安全(8个技能) 涵盖SBOM生成、依赖混淆检测、SLSA/Sigstore签名验证,在SolarWinds事件之后这些能力越来越刚需。

6大框架映射:这才是真正的技术含量

817个技能多不多?多。但真正让我觉得这个项目有技术深度的,是框架映射。每个技能都不是孤立的操作手册,而是被打上了6大行业框架的标签。

MITRE ATT&CK v19.1

754项技能完整映射到ATT&CK的15个战术、286个技术。注意这个版本号,v19.1。这个版本有个重要变化:原来Defense Evasion战术被拆成了两个,Stealth(TA0005)和Defense Impairment(TA0112)。拆分逻辑很清晰,隐匿行为和削弱防御是两种不同的技术目标,混在一起会让映射产生歧义。

NIST CSF 2.0

映射到6个功能(治理GV、识别ID、保护PR、检测DE、响应RS、恢复RC)、22个类别、106个子类别。CSF 2.0相比1.1最大的变化是新增了Govern(治理)功能,把网络安全治理提到和识别、保护同级。技能库跟上了这个变化。

MITRE ATLAS v5.4

16个战术、84个技术,专门针对AI系统的攻击框架。2025年底新增了Agent AI攻击向量,包括上下文投毒、工具调用滥用、MCP服务器入侵、恶意Agent部署。MCP服务器入侵在2025年已经有实际案例了,但大多数企业的AI安全还停留在"提示词过滤"阶段,差距很大。

MITRE D3FEND v1.3

NSA资助的防御知识图谱,267种防御技术,7个战术类别(建模、加固、检测、隔离、欺骗、驱逐、恢复)。D3FEND的价值在于它和ATT&CK形成对偶关系:知道攻击怎么做,也知道防御怎么防。

NIST AI RMF 1.0

4个核心职能、72个子类别,GenAI Profile新增12个风险类别。这里有个法律背景值得注意:科罗拉多州AI法案2026年2月生效,为遵守NIST AI RMF的组织提供法律安全港。也就是说,如果你的AI系统按照NIST AI RMF做了风险管理,出了问题可以免责。这直接推高了AI RMF框架的实用价值。

MITRE F3 (Fight Fraud Framework) v1.1

这个框架2026年4月9日刚发布,联合JPMorganChase、Citigroup、Lloyds、CrowdStrike等机构开发。123个技术,94项欺诈技能,两个专属战术:Positioning(FA0001)和Monetization(FA0002)。金融欺诈的攻击链和传统网络安全不同,F3第一次把欺诈行为结构化成了可映射的技术框架。

六个框架放在一起看,覆盖面从传统网络攻防(ATT&CK/D3FEND)到AI安全(ATLAS/AI RMF)到金融反欺诈(F3)到综合治理(CSF)。这套映射体系本身就是一份很有价值的安全知识工程。

agentskills.io标准:技能长什么样

这817个技能遵循agentskills.io开放标准。我拿一个具体技能拆解。

performing-memory-forensics-with-volatility3,用Volatility3做内存取证。它的frontmatter长这样:

yaml 复制代码
name: performing-memory-forensics-with-volatility3
description: 使用Volatility3框架对内存镜像进行取证分析
domain: Digital Forensics
subdomain: Memory Forensics
tags:
  - memory-forensics
  - volatility3
  - incident-response
atlas_techniques: AML.T0047
d3fend_techniques: D3-NTA
nist_ai_rmf: MEASURE-2.6
nist_csf: DE.CM
mitre_f3: FA0002
version: 1.0.0
author: mukul975
license: Apache-2.0

一个frontmatter同时映射到ATT&CK、NIST CSF、ATLAS、D3FEND、AI RMF、F3六个框架。AI Agent扫描这个frontmatter大约消耗30个token,就能判断这个技能是否和当前任务相关。

技能的目录结构也标准化了:

复制代码
performing-memory-forensics-with-volatility3/
├── SKILL.md              # 主技能文件
├── references/
│   ├── standards.md      # 相关标准和规范
│   └── workflows.md      # 详细工作流
├── scripts/              # 可执行脚本
└── assets/               # 资源文件

SKILL.md正文有四个标准章节:When to Use (什么时候用)、Prerequisites (前置条件)、Workflow (执行步骤)、Verification(验证方法)。这个结构设计得相当务实,不写废话,上来就告诉你在什么场景用、需要什么环境、怎么一步步执行、怎么验证结果对不对。

这就是agentskills.io标准的渐进式披露架构:Agent先花约30个token扫描frontmatter做初筛,匹配后再花500-2000个token加载完整技能内容。817个技能全部扫描一遍也就2万多token,成本可控。

AI Agent实际怎么用:一个完整工作流

继续用上面的内存取证技能举例,说清楚AI Agent的调用流程。

假设你是一个SOC分析师,拿到一个疑似被入侵的Windows主机内存镜像,需要快速分析。你把镜像路径告诉你的AI Agent(不管是Claude Code、Cursor还是别的),Agent的工作流程是:

复制代码
1. 扫描817个技能的frontmatter(约30 tokens/技能)
   → 匹配到12个与内存取证相关的技能

2. 按相关度排序,加载前3个技能的完整内容
   → performing-memory-forensics-with-volatility3
   → detecting-malware-in-memory
   → extracting-credentials-from-memory

3. 按SKILL.md中的Workflow分步执行
   → 检查Volatility3是否安装(Prerequisites)
   → 运行 windows.pslist 列出进程
   → 运行 windows.malfind 检测注入代码
   → 运行 windows.dumpfiles 提取可疑文件

4. 用Verification章节的方法验证结果
   → 交叉比对进程列表与已知恶意进程特征库
   → 验证提取文件的哈希值

这个过程里,AI Agent在执行结构化的安全操作流程,结果可复现、可审计。生成的结果可能出错,但执行标准化流程的结果是确定的。

26+平台兼容:生态比技能本身更重要

技能再多,如果只能在一个平台用,价值有限。这个项目的兼容性是亮点。

AI代码助手(12个):Claude Code、GitHub Copilot、Cursor、Windsurf、Cline、Aider、Continue、Roo Code、Amazon Q Developer、Tabnine、Sourcegraph Cody、JetBrains AI。基本上你叫得出名字的AI编程工具都在列。

CLI Agent(2个):OpenAI Codex CLI、Gemini CLI。适合命令行重度用户。

自主Agent(4个):Devin、Replit Agent、SWE-agent、OpenHands。这些Agent能自主规划任务、执行多步操作。

Agent框架(7+个):LangChain、CrewAI、AutoGen、Semantic Kernel、Haystack、Vercel AI SDK,以及任何兼容MCP的Agent。

26+个平台意味着什么?意味着你不会被困在某个厂商的生态里。今天用Claude Code,明天换Cursor,技能库照样能用。当前AI工具迭代速度极快,没人想因为换了工具就重新积累所有安全知识。跨平台兼容这件事,看起来不起眼,实际上是这个项目能走多远的关键。

安装和使用

两种方式,简单直接。

方式一,用npx一行命令安装:

bash 复制代码
npx skills add mukul975/Anthropic-Cybersecurity-Skills

方式二,直接git clone:

bash 复制代码
git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git

想先体验不想装?Casky.ai Playground提供在线环境,浏览器里直接跑。

用户怎么说

Hasan Toor(@hasantoxr)的评价比较到位:"这是一个真实、有条理的安全技能数据库,任何AI Agent都可以直接接入使用。不是教程,不是博客文章。"

Medium上的安全研究者fazal-sec写得更具体:"这不是一堆随机拼凑的安全脚本,而是一个专为AI驱动安全工作流设计的结构化操作知识库。"

两段话说的其实是同一件事:结构和标准化是这个项目的核心价值。安全社区从来不缺脚本和工具,缺的是把它们组织成机器可读、可执行、可审计的标准格式。

我的判断:价值和局限

说说我的看法。

价值在哪。 agentskills.io这套标准才是核心,817只是个数字。把安全操作知识结构化、标签化,做了框架映射,让AI Agent能像调用API一样调用安全技能,这个思路是方向性的。6大框架的映射体系尤其值钱,等于给AI Agent装了一套安全领域的知识图谱。防御和攻击对偶,传统安全和AI安全都覆盖,治理和执行也打通了,这套东西如果被广泛采纳,会成为AI安全运营的事实标准。

局限也很明显。 第一,技能质量参差不齐。817个技能由社区贡献,有些打磨得很细致,有些可能就是粗略的操作步骤。生产环境用之前必须逐个验证。第二,安全操作的容错率很低。AI Agent执行渗透测试或者取证分析,一步出错可能导致证据污染或者误报。Verification章节能降低风险,但不能消除。第三,这个项目目前还是个人主导的社区项目,长期维护和更新节奏存在不确定性。ATT&CK版本更新了,技能映射能不能跟上?新出现的攻击技术能不能及时补充?这些都是问题。

第四,也是我觉得最关键的:安全技能的"可执行"和"应该执行"之间有巨大鸿沟。AI Agent知道怎么做内存取证,不等于它应该在没有人类确认的情况下自动执行。安全操作需要判断力、需要上下文、需要对业务影响的理解。技能库解决了"怎么做"的问题,但"什么时候做、做不做"的决策权必须留在人手里。

给开发者的建议

如果你是安全工程师或开发安全工具的程序员,我建议这么用这个项目:

第一,别急着把817个技能全装上。先从你所在领域最相关的5-10个技能开始,逐个读SKILL.md,理解Workflow和Verification的设计逻辑,验证输出结果是否靠谱。

第二,把框架映射当学习材料。即使你不打算用AI Agent做安全运营,6大框架的映射关系本身就是很好的安全知识体系梳理。特别是ATLAS和F3这两个较新的框架,很多人还不熟悉。

第三,如果你在开发安全产品,认真研究agentskills.io标准的设计思路。渐进式披露、frontmatter标签、标准化章节,这套设计模式不只适用于安全技能,任何需要AI Agent调用的领域知识库都可以借鉴。

第四,参与贡献。这是Apache 2.0开源项目,如果你发现某个技能的Workflow有误或者缺少你领域的技能,提PR。社区项目的生命力取决于贡献者。

817个技能是个起点,不是终点。网络安全这个领域,知识更新速度远超任何一个人或团队的消化能力。把操作知识标准化、结构化,交给AI Agent去执行,让人专注于判断和决策。这大概是480万人才缺口下最务实的解法。