817个安全技能,6个框架,26+平台兼容:Anthropic正在用AI重写网络安全规则
ISC2的数据摆在那:2024年全球网络安全人才缺口480万个空缺职位。这个数字我反复看了几遍,不是48万,是480万。与此同时,AI Agent的代码能力已经强到可以独立完成漏洞分析、日志取证、甚至红队渗透的部分流程。
一边是人不够用,一边是机器越来越能干。Anthropic社区开发者Mahipal Jangra(@mukul975)做了一件事:把817个生产级网络安全技能打包成AI Agent可以直接调用的标准格式,开源在GitHub上。Apache License 2.0,随便用。
项目名叫Anthropic-Cybersecurity-Skills,但得说清楚:这是一个独立社区项目,和Anthropic PBC没有官方关联。用Anthropic的名字,更多是因为这些技能最初面向Claude生态设计,现在已扩展到26+个AI平台。
817个技能,29个领域:到底有什么
先看规模。817个技能,覆盖29个安全领域,分类很细,每个技能都是可执行的操作手册。我挑几个重点领域拆开说。
云安全(66个技能) 是数量最多的领域。覆盖AWS、Azure、GCP三大云的加固配置、CSPM(云安全态势管理)、云端攻击模拟和云取证。如果你做过云安全合规,就知道CIS Benchmark的检查项有多碎,人工过一遍几百条规则要花一整天。这些技能把检查逻辑结构化后,AI Agent可以批量扫描、生成报告、甚至自动修复部分配置。
威胁猎捕(58个技能) 偏实战。假设驱动猎捕、LOTL(Living Off The Land)检测、EVTX日志猎捕,这些是SOC分析师每天打交道的东西。技能里包含具体的检测规则、查询语句和验证方法,不是教科书概念。
威胁情报(52个技能) 对接STIX/TAXII、MISP、OpenCTI这些主流情报平台,覆盖情报的生产、消费、共享全流程。
数字取证(41个技能) 这块我特别关注。磁盘镜像、内存取证、时间线分析,技能里集成了Hayabusa、KAPE、Plaso这些取证圈的标准工具链。做过取证的人知道,时间线重建是最耗时的环节,Plaso跑一个500GB的镜像可能要几个小时。如果AI Agent能自动化预处理、筛选关键时间窗口,效率提升是实打实的。
红队(33个技能) 包含ADCS/Certipy、BloodHound CE、Sliver/Havoc C2。这些工具在红队演练里几乎是标配。技能把它们的使用流程结构化,AI Agent可以根据目标环境自动选择攻击路径。
完整领域列表我列个表,大家感受一下覆盖面:
| 排名 | 领域 | 技能数 | 核心能力 |
|---|---|---|---|
| 1 | Cloud Security(云安全) | 66 | AWS/Azure/GCP加固、CSPM、攻击模拟 |
| 2 | Threat Hunting(威胁猎捕) | 58 | 假设驱动猎捕、LOTL检测、EVTX猎捕 |
| 3 | Threat Intelligence(威胁情报) | 52 | STIX/TAXII、MISP、OpenCTI |
| 4 | Network Security(网络安全) | 43 | IDS/IPS、防火墙规则、VLAN分段 |
| 5 | Web Application Security(Web应用安全) | 42 | OWASP Top 10、SQLi、XSS、SSRF |
| 6 | Digital Forensics(数字取证) | 41 | 磁盘镜像、内存取证、时间线分析 |
| 7 | Malware Analysis(恶意软件分析) | 39 | 静态/动态分析、逆向工程 |
| 8 | Identity & Access Management | 37 | Entra ID/ROADtools、零信任 |
| 9 | SOC Operations(SOC运营) | 35 | 剧本、升级工作流 |
| 10 | Red Teaming(红队) | 33 | ADCS/Certipy、BloodHound CE、C2框架 |
还有19个领域没有全部列出,但有两个值得单独提。AI安全(14个技能) 覆盖LLM红队测试(garak/PyRIT)、提示注入检测、MCP/Agentic安全,这是当下最热的方向。供应链安全(8个技能) 涵盖SBOM生成、依赖混淆检测、SLSA/Sigstore签名验证,在SolarWinds事件之后这些能力越来越刚需。
6大框架映射:这才是真正的技术含量
817个技能多不多?多。但真正让我觉得这个项目有技术深度的,是框架映射。每个技能都不是孤立的操作手册,而是被打上了6大行业框架的标签。
MITRE ATT&CK v19.1
754项技能完整映射到ATT&CK的15个战术、286个技术。注意这个版本号,v19.1。这个版本有个重要变化:原来Defense Evasion战术被拆成了两个,Stealth(TA0005)和Defense Impairment(TA0112)。拆分逻辑很清晰,隐匿行为和削弱防御是两种不同的技术目标,混在一起会让映射产生歧义。
NIST CSF 2.0
映射到6个功能(治理GV、识别ID、保护PR、检测DE、响应RS、恢复RC)、22个类别、106个子类别。CSF 2.0相比1.1最大的变化是新增了Govern(治理)功能,把网络安全治理提到和识别、保护同级。技能库跟上了这个变化。
MITRE ATLAS v5.4
16个战术、84个技术,专门针对AI系统的攻击框架。2025年底新增了Agent AI攻击向量,包括上下文投毒、工具调用滥用、MCP服务器入侵、恶意Agent部署。MCP服务器入侵在2025年已经有实际案例了,但大多数企业的AI安全还停留在"提示词过滤"阶段,差距很大。
MITRE D3FEND v1.3
NSA资助的防御知识图谱,267种防御技术,7个战术类别(建模、加固、检测、隔离、欺骗、驱逐、恢复)。D3FEND的价值在于它和ATT&CK形成对偶关系:知道攻击怎么做,也知道防御怎么防。
NIST AI RMF 1.0
4个核心职能、72个子类别,GenAI Profile新增12个风险类别。这里有个法律背景值得注意:科罗拉多州AI法案2026年2月生效,为遵守NIST AI RMF的组织提供法律安全港。也就是说,如果你的AI系统按照NIST AI RMF做了风险管理,出了问题可以免责。这直接推高了AI RMF框架的实用价值。
MITRE F3 (Fight Fraud Framework) v1.1
这个框架2026年4月9日刚发布,联合JPMorganChase、Citigroup、Lloyds、CrowdStrike等机构开发。123个技术,94项欺诈技能,两个专属战术:Positioning(FA0001)和Monetization(FA0002)。金融欺诈的攻击链和传统网络安全不同,F3第一次把欺诈行为结构化成了可映射的技术框架。
六个框架放在一起看,覆盖面从传统网络攻防(ATT&CK/D3FEND)到AI安全(ATLAS/AI RMF)到金融反欺诈(F3)到综合治理(CSF)。这套映射体系本身就是一份很有价值的安全知识工程。
agentskills.io标准:技能长什么样
这817个技能遵循agentskills.io开放标准。我拿一个具体技能拆解。
performing-memory-forensics-with-volatility3,用Volatility3做内存取证。它的frontmatter长这样:
yaml
name: performing-memory-forensics-with-volatility3
description: 使用Volatility3框架对内存镜像进行取证分析
domain: Digital Forensics
subdomain: Memory Forensics
tags:
- memory-forensics
- volatility3
- incident-response
atlas_techniques: AML.T0047
d3fend_techniques: D3-NTA
nist_ai_rmf: MEASURE-2.6
nist_csf: DE.CM
mitre_f3: FA0002
version: 1.0.0
author: mukul975
license: Apache-2.0
一个frontmatter同时映射到ATT&CK、NIST CSF、ATLAS、D3FEND、AI RMF、F3六个框架。AI Agent扫描这个frontmatter大约消耗30个token,就能判断这个技能是否和当前任务相关。
技能的目录结构也标准化了:
performing-memory-forensics-with-volatility3/
├── SKILL.md # 主技能文件
├── references/
│ ├── standards.md # 相关标准和规范
│ └── workflows.md # 详细工作流
├── scripts/ # 可执行脚本
└── assets/ # 资源文件
SKILL.md正文有四个标准章节:When to Use (什么时候用)、Prerequisites (前置条件)、Workflow (执行步骤)、Verification(验证方法)。这个结构设计得相当务实,不写废话,上来就告诉你在什么场景用、需要什么环境、怎么一步步执行、怎么验证结果对不对。
这就是agentskills.io标准的渐进式披露架构:Agent先花约30个token扫描frontmatter做初筛,匹配后再花500-2000个token加载完整技能内容。817个技能全部扫描一遍也就2万多token,成本可控。
AI Agent实际怎么用:一个完整工作流
继续用上面的内存取证技能举例,说清楚AI Agent的调用流程。
假设你是一个SOC分析师,拿到一个疑似被入侵的Windows主机内存镜像,需要快速分析。你把镜像路径告诉你的AI Agent(不管是Claude Code、Cursor还是别的),Agent的工作流程是:
1. 扫描817个技能的frontmatter(约30 tokens/技能)
→ 匹配到12个与内存取证相关的技能
2. 按相关度排序,加载前3个技能的完整内容
→ performing-memory-forensics-with-volatility3
→ detecting-malware-in-memory
→ extracting-credentials-from-memory
3. 按SKILL.md中的Workflow分步执行
→ 检查Volatility3是否安装(Prerequisites)
→ 运行 windows.pslist 列出进程
→ 运行 windows.malfind 检测注入代码
→ 运行 windows.dumpfiles 提取可疑文件
4. 用Verification章节的方法验证结果
→ 交叉比对进程列表与已知恶意进程特征库
→ 验证提取文件的哈希值
这个过程里,AI Agent在执行结构化的安全操作流程,结果可复现、可审计。生成的结果可能出错,但执行标准化流程的结果是确定的。
26+平台兼容:生态比技能本身更重要
技能再多,如果只能在一个平台用,价值有限。这个项目的兼容性是亮点。
AI代码助手(12个):Claude Code、GitHub Copilot、Cursor、Windsurf、Cline、Aider、Continue、Roo Code、Amazon Q Developer、Tabnine、Sourcegraph Cody、JetBrains AI。基本上你叫得出名字的AI编程工具都在列。
CLI Agent(2个):OpenAI Codex CLI、Gemini CLI。适合命令行重度用户。
自主Agent(4个):Devin、Replit Agent、SWE-agent、OpenHands。这些Agent能自主规划任务、执行多步操作。
Agent框架(7+个):LangChain、CrewAI、AutoGen、Semantic Kernel、Haystack、Vercel AI SDK,以及任何兼容MCP的Agent。
26+个平台意味着什么?意味着你不会被困在某个厂商的生态里。今天用Claude Code,明天换Cursor,技能库照样能用。当前AI工具迭代速度极快,没人想因为换了工具就重新积累所有安全知识。跨平台兼容这件事,看起来不起眼,实际上是这个项目能走多远的关键。
安装和使用
两种方式,简单直接。
方式一,用npx一行命令安装:
bash
npx skills add mukul975/Anthropic-Cybersecurity-Skills
方式二,直接git clone:
bash
git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git
想先体验不想装?Casky.ai Playground提供在线环境,浏览器里直接跑。
用户怎么说
Hasan Toor(@hasantoxr)的评价比较到位:"这是一个真实、有条理的安全技能数据库,任何AI Agent都可以直接接入使用。不是教程,不是博客文章。"
Medium上的安全研究者fazal-sec写得更具体:"这不是一堆随机拼凑的安全脚本,而是一个专为AI驱动安全工作流设计的结构化操作知识库。"
两段话说的其实是同一件事:结构和标准化是这个项目的核心价值。安全社区从来不缺脚本和工具,缺的是把它们组织成机器可读、可执行、可审计的标准格式。
我的判断:价值和局限
说说我的看法。
价值在哪。 agentskills.io这套标准才是核心,817只是个数字。把安全操作知识结构化、标签化,做了框架映射,让AI Agent能像调用API一样调用安全技能,这个思路是方向性的。6大框架的映射体系尤其值钱,等于给AI Agent装了一套安全领域的知识图谱。防御和攻击对偶,传统安全和AI安全都覆盖,治理和执行也打通了,这套东西如果被广泛采纳,会成为AI安全运营的事实标准。
局限也很明显。 第一,技能质量参差不齐。817个技能由社区贡献,有些打磨得很细致,有些可能就是粗略的操作步骤。生产环境用之前必须逐个验证。第二,安全操作的容错率很低。AI Agent执行渗透测试或者取证分析,一步出错可能导致证据污染或者误报。Verification章节能降低风险,但不能消除。第三,这个项目目前还是个人主导的社区项目,长期维护和更新节奏存在不确定性。ATT&CK版本更新了,技能映射能不能跟上?新出现的攻击技术能不能及时补充?这些都是问题。
第四,也是我觉得最关键的:安全技能的"可执行"和"应该执行"之间有巨大鸿沟。AI Agent知道怎么做内存取证,不等于它应该在没有人类确认的情况下自动执行。安全操作需要判断力、需要上下文、需要对业务影响的理解。技能库解决了"怎么做"的问题,但"什么时候做、做不做"的决策权必须留在人手里。
给开发者的建议
如果你是安全工程师或开发安全工具的程序员,我建议这么用这个项目:
第一,别急着把817个技能全装上。先从你所在领域最相关的5-10个技能开始,逐个读SKILL.md,理解Workflow和Verification的设计逻辑,验证输出结果是否靠谱。
第二,把框架映射当学习材料。即使你不打算用AI Agent做安全运营,6大框架的映射关系本身就是很好的安全知识体系梳理。特别是ATLAS和F3这两个较新的框架,很多人还不熟悉。
第三,如果你在开发安全产品,认真研究agentskills.io标准的设计思路。渐进式披露、frontmatter标签、标准化章节,这套设计模式不只适用于安全技能,任何需要AI Agent调用的领域知识库都可以借鉴。
第四,参与贡献。这是Apache 2.0开源项目,如果你发现某个技能的Workflow有误或者缺少你领域的技能,提PR。社区项目的生命力取决于贡献者。
817个技能是个起点,不是终点。网络安全这个领域,知识更新速度远超任何一个人或团队的消化能力。把操作知识标准化、结构化,交给AI Agent去执行,让人专注于判断和决策。这大概是480万人才缺口下最务实的解法。