817个安全技能，6个框架，26+平台兼容：Anthropic正在用AI重写网络安全规则

ISC2的数据摆在那：2024年全球网络安全人才缺口480万个空缺职位。这个数字我反复看了几遍，不是48万，是480万。与此同时，AI Agent的代码能力已经强到可以独立完成漏洞分析、日志取证、甚至红队渗透的部分流程。

一边是人不够用，一边是机器越来越能干。Anthropic社区开发者Mahipal Jangra（@mukul975）做了一件事：把817个生产级网络安全技能打包成AI Agent可以直接调用的标准格式，开源在GitHub上。Apache License 2.0，随便用。

项目名叫Anthropic-Cybersecurity-Skills，但得说清楚：这是一个独立社区项目，和Anthropic PBC没有官方关联。用Anthropic的名字，更多是因为这些技能最初面向Claude生态设计，现在已扩展到26+个AI平台。

817个技能，29个领域：到底有什么

先看规模。817个技能，覆盖29个安全领域，分类很细，每个技能都是可执行的操作手册。我挑几个重点领域拆开说。

云安全（66个技能） 是数量最多的领域。覆盖AWS、Azure、GCP三大云的加固配置、CSPM（云安全态势管理）、云端攻击模拟和云取证。如果你做过云安全合规，就知道CIS Benchmark的检查项有多碎，人工过一遍几百条规则要花一整天。这些技能把检查逻辑结构化后，AI Agent可以批量扫描、生成报告、甚至自动修复部分配置。

威胁猎捕（58个技能） 偏实战。假设驱动猎捕、LOTL（Living Off The Land）检测、EVTX日志猎捕，这些是SOC分析师每天打交道的东西。技能里包含具体的检测规则、查询语句和验证方法，不是教科书概念。

威胁情报（52个技能） 对接STIX/TAXII、MISP、OpenCTI这些主流情报平台，覆盖情报的生产、消费、共享全流程。

数字取证（41个技能） 这块我特别关注。磁盘镜像、内存取证、时间线分析，技能里集成了Hayabusa、KAPE、Plaso这些取证圈的标准工具链。做过取证的人知道，时间线重建是最耗时的环节，Plaso跑一个500GB的镜像可能要几个小时。如果AI Agent能自动化预处理、筛选关键时间窗口，效率提升是实打实的。

红队（33个技能） 包含ADCS/Certipy、BloodHound CE、Sliver/Havoc C2。这些工具在红队演练里几乎是标配。技能把它们的使用流程结构化，AI Agent可以根据目标环境自动选择攻击路径。

完整领域列表我列个表，大家感受一下覆盖面：

排名	领域	技能数	核心能力
1	Cloud Security（云安全）	66	AWS/Azure/GCP加固、CSPM、攻击模拟
2	Threat Hunting（威胁猎捕）	58	假设驱动猎捕、LOTL检测、EVTX猎捕
3	Threat Intelligence（威胁情报）	52	STIX/TAXII、MISP、OpenCTI
4	Network Security（网络安全）	43	IDS/IPS、防火墙规则、VLAN分段
5	Web Application Security（Web应用安全）	42	OWASP Top 10、SQLi、XSS、SSRF
6	Digital Forensics（数字取证）	41	磁盘镜像、内存取证、时间线分析
7	Malware Analysis（恶意软件分析）	39	静态/动态分析、逆向工程
8	Identity & Access Management	37	Entra ID/ROADtools、零信任
9	SOC Operations（SOC运营）	35	剧本、升级工作流
10	Red Teaming（红队）	33	ADCS/Certipy、BloodHound CE、C2框架

还有19个领域没有全部列出，但有两个值得单独提。AI安全（14个技能） 覆盖LLM红队测试（garak/PyRIT）、提示注入检测、MCP/Agentic安全，这是当下最热的方向。供应链安全（8个技能） 涵盖SBOM生成、依赖混淆检测、SLSA/Sigstore签名验证，在SolarWinds事件之后这些能力越来越刚需。

6大框架映射：这才是真正的技术含量

817个技能多不多？多。但真正让我觉得这个项目有技术深度的，是框架映射。每个技能都不是孤立的操作手册，而是被打上了6大行业框架的标签。

MITRE ATT&CK v19.1

754项技能完整映射到ATT&CK的15个战术、286个技术。注意这个版本号，v19.1。这个版本有个重要变化：原来Defense Evasion战术被拆成了两个，Stealth（TA0005）和Defense Impairment（TA0112）。拆分逻辑很清晰，隐匿行为和削弱防御是两种不同的技术目标，混在一起会让映射产生歧义。

NIST CSF 2.0

映射到6个功能（治理GV、识别ID、保护PR、检测DE、响应RS、恢复RC）、22个类别、106个子类别。CSF 2.0相比1.1最大的变化是新增了Govern（治理）功能，把网络安全治理提到和识别、保护同级。技能库跟上了这个变化。

MITRE ATLAS v5.4

16个战术、84个技术，专门针对AI系统的攻击框架。2025年底新增了Agent AI攻击向量，包括上下文投毒、工具调用滥用、MCP服务器入侵、恶意Agent部署。MCP服务器入侵在2025年已经有实际案例了，但大多数企业的AI安全还停留在"提示词过滤"阶段，差距很大。

MITRE D3FEND v1.3

NSA资助的防御知识图谱，267种防御技术，7个战术类别（建模、加固、检测、隔离、欺骗、驱逐、恢复）。D3FEND的价值在于它和ATT&CK形成对偶关系：知道攻击怎么做，也知道防御怎么防。

NIST AI RMF 1.0

4个核心职能、72个子类别，GenAI Profile新增12个风险类别。这里有个法律背景值得注意：科罗拉多州AI法案2026年2月生效，为遵守NIST AI RMF的组织提供法律安全港。也就是说，如果你的AI系统按照NIST AI RMF做了风险管理，出了问题可以免责。这直接推高了AI RMF框架的实用价值。

MITRE F3 (Fight Fraud Framework) v1.1

这个框架2026年4月9日刚发布，联合JPMorganChase、Citigroup、Lloyds、CrowdStrike等机构开发。123个技术，94项欺诈技能，两个专属战术：Positioning（FA0001）和Monetization（FA0002）。金融欺诈的攻击链和传统网络安全不同，F3第一次把欺诈行为结构化成了可映射的技术框架。

六个框架放在一起看，覆盖面从传统网络攻防（ATT&CK/D3FEND）到AI安全（ATLAS/AI RMF）到金融反欺诈（F3）到综合治理（CSF）。这套映射体系本身就是一份很有价值的安全知识工程。

agentskills.io标准：技能长什么样

这817个技能遵循agentskills.io开放标准。我拿一个具体技能拆解。

performing-memory-forensics-with-volatility3，用Volatility3做内存取证。它的frontmatter长这样：

yaml 复制代码

name: performing-memory-forensics-with-volatility3
description: 使用Volatility3框架对内存镜像进行取证分析
domain: Digital Forensics
subdomain: Memory Forensics
tags:
  - memory-forensics
  - volatility3
  - incident-response
atlas_techniques: AML.T0047
d3fend_techniques: D3-NTA
nist_ai_rmf: MEASURE-2.6
nist_csf: DE.CM
mitre_f3: FA0002
version: 1.0.0
author: mukul975
license: Apache-2.0

一个frontmatter同时映射到ATT&CK、NIST CSF、ATLAS、D3FEND、AI RMF、F3六个框架。AI Agent扫描这个frontmatter大约消耗30个token，就能判断这个技能是否和当前任务相关。

技能的目录结构也标准化了：

复制代码

performing-memory-forensics-with-volatility3/
├── SKILL.md              # 主技能文件
├── references/
│   ├── standards.md      # 相关标准和规范
│   └── workflows.md      # 详细工作流
├── scripts/              # 可执行脚本
└── assets/               # 资源文件

SKILL.md正文有四个标准章节：When to Use （什么时候用）、Prerequisites （前置条件）、Workflow （执行步骤）、Verification（验证方法）。这个结构设计得相当务实，不写废话，上来就告诉你在什么场景用、需要什么环境、怎么一步步执行、怎么验证结果对不对。

这就是agentskills.io标准的渐进式披露架构：Agent先花约30个token扫描frontmatter做初筛，匹配后再花500-2000个token加载完整技能内容。817个技能全部扫描一遍也就2万多token，成本可控。

AI Agent实际怎么用：一个完整工作流

继续用上面的内存取证技能举例，说清楚AI Agent的调用流程。

假设你是一个SOC分析师，拿到一个疑似被入侵的Windows主机内存镜像，需要快速分析。你把镜像路径告诉你的AI Agent（不管是Claude Code、Cursor还是别的），Agent的工作流程是：

复制代码

1. 扫描817个技能的frontmatter（约30 tokens/技能）
   → 匹配到12个与内存取证相关的技能

2. 按相关度排序，加载前3个技能的完整内容
   → performing-memory-forensics-with-volatility3
   → detecting-malware-in-memory
   → extracting-credentials-from-memory

3. 按SKILL.md中的Workflow分步执行
   → 检查Volatility3是否安装（Prerequisites）
   → 运行 windows.pslist 列出进程
   → 运行 windows.malfind 检测注入代码
   → 运行 windows.dumpfiles 提取可疑文件

4. 用Verification章节的方法验证结果
   → 交叉比对进程列表与已知恶意进程特征库
   → 验证提取文件的哈希值

这个过程里，AI Agent在执行结构化的安全操作流程，结果可复现、可审计。生成的结果可能出错，但执行标准化流程的结果是确定的。

26+平台兼容：生态比技能本身更重要

技能再多，如果只能在一个平台用，价值有限。这个项目的兼容性是亮点。

AI代码助手（12个）：Claude Code、GitHub Copilot、Cursor、Windsurf、Cline、Aider、Continue、Roo Code、Amazon Q Developer、Tabnine、Sourcegraph Cody、JetBrains AI。基本上你叫得出名字的AI编程工具都在列。

CLI Agent（2个）：OpenAI Codex CLI、Gemini CLI。适合命令行重度用户。

自主Agent（4个）：Devin、Replit Agent、SWE-agent、OpenHands。这些Agent能自主规划任务、执行多步操作。

Agent框架（7+个）：LangChain、CrewAI、AutoGen、Semantic Kernel、Haystack、Vercel AI SDK，以及任何兼容MCP的Agent。

26+个平台意味着什么？意味着你不会被困在某个厂商的生态里。今天用Claude Code，明天换Cursor，技能库照样能用。当前AI工具迭代速度极快，没人想因为换了工具就重新积累所有安全知识。跨平台兼容这件事，看起来不起眼，实际上是这个项目能走多远的关键。

安装和使用

两种方式，简单直接。

方式一，用npx一行命令安装：

bash 复制代码

npx skills add mukul975/Anthropic-Cybersecurity-Skills

方式二，直接git clone：

bash 复制代码

git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git

想先体验不想装？Casky.ai Playground提供在线环境，浏览器里直接跑。

用户怎么说

Hasan Toor（@hasantoxr）的评价比较到位："这是一个真实、有条理的安全技能数据库，任何AI Agent都可以直接接入使用。不是教程，不是博客文章。"

Medium上的安全研究者fazal-sec写得更具体："这不是一堆随机拼凑的安全脚本，而是一个专为AI驱动安全工作流设计的结构化操作知识库。"

两段话说的其实是同一件事：结构和标准化是这个项目的核心价值。安全社区从来不缺脚本和工具，缺的是把它们组织成机器可读、可执行、可审计的标准格式。

我的判断：价值和局限

说说我的看法。

价值在哪。 agentskills.io这套标准才是核心，817只是个数字。把安全操作知识结构化、标签化，做了框架映射，让AI Agent能像调用API一样调用安全技能，这个思路是方向性的。6大框架的映射体系尤其值钱，等于给AI Agent装了一套安全领域的知识图谱。防御和攻击对偶，传统安全和AI安全都覆盖，治理和执行也打通了，这套东西如果被广泛采纳，会成为AI安全运营的事实标准。

局限也很明显。 第一，技能质量参差不齐。817个技能由社区贡献，有些打磨得很细致，有些可能就是粗略的操作步骤。生产环境用之前必须逐个验证。第二，安全操作的容错率很低。AI Agent执行渗透测试或者取证分析，一步出错可能导致证据污染或者误报。Verification章节能降低风险，但不能消除。第三，这个项目目前还是个人主导的社区项目，长期维护和更新节奏存在不确定性。ATT&CK版本更新了，技能映射能不能跟上？新出现的攻击技术能不能及时补充？这些都是问题。

第四，也是我觉得最关键的：安全技能的"可执行"和"应该执行"之间有巨大鸿沟。AI Agent知道怎么做内存取证，不等于它应该在没有人类确认的情况下自动执行。安全操作需要判断力、需要上下文、需要对业务影响的理解。技能库解决了"怎么做"的问题，但"什么时候做、做不做"的决策权必须留在人手里。

给开发者的建议

如果你是安全工程师或开发安全工具的程序员，我建议这么用这个项目：

第一，别急着把817个技能全装上。先从你所在领域最相关的5-10个技能开始，逐个读SKILL.md，理解Workflow和Verification的设计逻辑，验证输出结果是否靠谱。

第二，把框架映射当学习材料。即使你不打算用AI Agent做安全运营，6大框架的映射关系本身就是很好的安全知识体系梳理。特别是ATLAS和F3这两个较新的框架，很多人还不熟悉。

第三，如果你在开发安全产品，认真研究agentskills.io标准的设计思路。渐进式披露、frontmatter标签、标准化章节，这套设计模式不只适用于安全技能，任何需要AI Agent调用的领域知识库都可以借鉴。

第四，参与贡献。这是Apache 2.0开源项目，如果你发现某个技能的Workflow有误或者缺少你领域的技能，提PR。社区项目的生命力取决于贡献者。

817个技能是个起点，不是终点。网络安全这个领域，知识更新速度远超任何一个人或团队的消化能力。把操作知识标准化、结构化，交给AI Agent去执行，让人专注于判断和决策。这大概是480万人才缺口下最务实的解法。