LLM 自动生成安全基线与等保合规初稿——把“网络工程事实”转译为“可审计的制度语言”

LLM 自动生成安全基线与等保合规初稿------把"网络工程事实"转译为"可审计的制度语言"

引言：为什么合规问题，本质上是网络工程问题

在多数企业里，"等保""合规""安全基线"常被当成一件行政性工作：

填表
写说明
对条款
应付审计

而真正的网络工程师，往往被要求做两件彼此割裂的事情：

一边是，VLAN、ACL、防火墙策略、日志、账号体系

另一边是，安全管理制度、技术措施说明、控制项符合性证明这不是能力问题，而是语言体系的问题。

合规条款使用的是制度语言 ，而网络工程产生的是工程事实。

过去十几年，这两套语言之间的转换，完全依赖人工经验：谁懂点技术、又懂点合规，谁就成了"关键人"。

这正是 LLM 可以切入、而且必须切入的地方。

但前提是：你不能把 LLM 当成"写文档的工具"，而要把它当成"语义翻译引擎"。

1、问题重新定义：合规不是"写得好"，而是"映射得准"

在进入 AI 之前，我们先把问题定义清楚。

1.1 等保 / 合规工作的真实结构

以等保 2.0（三级）为例，任何一次正式评估，本质上都会要求你完成三件事：

控制项存在性证明
控制项实施方式说明
证据链可追溯

注意：没有一条是"文采好"或"格式漂亮"。

它们真正关心的是：你的网络与系统中，是否存在某一类"控制对象"，且该对象是否以可验证的方式被实现。

1.2 网络工程师卡在哪里

从工程视角看，现实往往是这样：

防火墙策略已经很复杂
日志已经开了
AAA / RBAC 已经做了
区域划分已经存在

但你要让工程师回答：

"请说明你们如何满足 8.1.3 边界防护 条款"

他往往只能给你一句："我们有防火墙。"

而这句话，在合规语义里，是零分。

1.3 合规的本质：对象 × 关系 × 证据

如果我们抽象一下，合规条款其实都可以拆成三类元素：

对象（Object）
- 网络区域
- 系统资产
- 安全设备
- 管理账户
关系（Relation）
- 控制
- 隔离
- 记录
- 审计
证据（Evidence）
- 配置
- 日志
- 策略
- 截图 / 报表

问题不在于你没有这些东西，

而在于：
你从未系统性地把它们"结构化表达"出来。

2、LLM 在这里的真实角色：合规语义映射引擎

这一节是本篇的核心思想，也是与常见"AI 写文档"文章的根本分界线。

2.1 错误认知：让 LLM"帮我写等保文档"

如果你的输入是：

"这是我们的网络情况，帮我写一份等保三级文档。"

那你得到的，只会是：

模板化文字
看似完整
实际不可审

这种内容，在正式测评中毫无价值。

2.2 正确认知：让 LLM 做"语义映射"

LLM 在合规中的正确定位是：

把工程事实 → 映射成合规语义 → 组织为制度文本

也就是说，LLM 的输入不是"描述性文字"，而是结构化的工程事实集合。

2.3 映射的三层结构

一个可工作的合规 AI 流水线，至少包含三层：

第一层：工程事实抽取（Fact Extraction）

配置
策略
日志开关
账号与权限

第二层：合规语义对齐（Clause Mapping）

等保条款
控制目标
技术措施类型

第三层：证据化表达（Evidence Rendering）

"如何实现"
"在哪里实现"
"如何验证"

LLM 只负责第二、三层，但前提是第一层必须干净。

3、构建"合规可识别"的网络工程对象模型

接下来进入工程层面。

3.1 为什么要先做对象模型，而不是直接喂配置

直接把设备配置扔给 LLM，有三个问题：

噪声极高
语义混杂
无法复用

合规不是一次性工作，它是每年、每次变更、每次审计都会复用的能力。

所以必须先做抽象。

3.2 最小可用的合规对象模型（示例）

下面是一个足够应付等保三级的最小对象模型：

javascript 复制代码

{

  "network_zones": [

    {

      "name": "DMZ",

      "description": "对外服务区",

      "connected_zones": ["INTERNAL"],

      "security_devices": ["FW-01"]

    }

  ],

  "security_controls": {

    "firewall": {

      "device": "FW-01",

      "policies": [

        {

          "src_zone": "DMZ",

          "dst_zone": "INTERNAL",

          "action": "deny",

          "logging": true

        }

      ]

    },

    "logging": {

      "syslog_server": "10.10.10.10",

      "log_types": ["traffic", "security", "auth"]

    },

    "access_control": {

      "aaa": true,

      "rbac": true,

      "account_review_cycle_days": 90

    }

  }

}

注意：
这里没有厂商命令，也没有 CLI。

这是"工程事实的抽象表示"。

3.3 对象模型与等保条款的关系

以等保 2.0 的常见条款为例：

条款类型	实际映射对象
边界防护	network_zones + firewall
访问控制	access_control
安全审计	logging
身份鉴别	aaa / rbac

一旦你有了这个映射关系，合规就不再是"写"，而是"生成"。

4、LLM 合规流水线总体架构

在进入具体案例和代码前，我们先把整体架构说清楚。

4.1 架构总览（逻辑）

javascript 复制代码

设备配置 / 日志

        ↓

工程抽取脚本（Python / Ansible）

        ↓

合规对象模型（JSON）

        ↓

LLM 合规映射 Prompt

        ↓

合规初稿（条款级）

        ↓

人工复核 & 审计补充

这不是"全自动"，

而是把 70% 最耗时、最低价值的工作自动化。

4.2 LLM 不该接触的东西

在这个体系里，有三类内容不应该直接交给 LLM：

设备原始配置全文
未脱敏的账号信息
大规模日志原文

LLM 只处理结构化后的事实。

4.3 为什么这套体系是"工程级"的

因为它满足三个条件：

可复用：对象模型可以持续演进
可验证：每条结论都能回指配置或日志
可审计：输出结构天然贴合审计逻辑

这也是它与"写作文 AI"的本质区别。

5、真实案例：园区网 + 防火墙的等保三级合规生成全过程

这一节开始，我们不再停留在"模型"和"架构"，而是完整走一遍真实工程场景。

5.1 场景背景与合规目标

场景设定（来自大量真实企业的"平均态"）：

一个中型企业园区网
核心 + 汇聚 + 接入三层架构
一套出口防火墙（双机热备）
内外网逻辑隔离，存在 DMZ
已要求通过 等保 2.0 三级

合规目标不是"一次性应付检查"，而是：

让网络工程事实 → 自动生成可复用的安全基线与等保条款初稿，且在网络变更后，能够低成本更新。

5.2 原始工程事实（工程侧视角）

在工程侧，网络工程师真正"知道"的信息包括：

哪些网段属于 DMZ / 内部网
防火墙策略是怎么限制流向的
是否开启日志、日志送往哪里
管理账号如何鉴权、是否定期复核

但这些信息通常散落在：

防火墙配置
网络设计文档
运维经验里

我们要做的第一步，是把这些事实抽出来，而不是"描述它们"。

6、工程事实抽取：从配置到结构化对象

6.1 抽取目标不是"还原配置"，而是"抽象事实"

这是很多人会犯的第一个错误：试图把配置完整解析出来。

合规不需要完整配置，它需要的是：

区域关系
控制存在性
行为是否被记录

6.2 示例：防火墙配置的最小抽取逻辑（Python）

假设你已经能从设备上拿到防火墙策略（通过 API / SSH / 备份文件都可以），这里给一个极简但可运行的示例。

python 复制代码

import re


def extract_firewall_facts(config_text):

    zones = set()

    policies = []


    for line in config_text.splitlines():

        if "zone" in line:

            zones.add(line.strip())


        if "deny" in line or "permit" in line:

            policies.append({

                "raw": line.strip(),

                "logging": "log" in line.lower()

            })


    return {

        "zones": list(zones),

        "policies": policies

    }

这段代码并不优雅，也不完整，但它体现了一件事：

我们关心的不是"这条命令怎么写"，而是"它是否体现了某类安全控制"。

在生产环境中，可结合 TextFSM 或厂商自带的 API/模板进行更精准的结构化提取。

6.3 生成合规对象模型（工程侧输出）

在实际系统中，你会把多个来源的抽取结果合并，最终生成一个统一对象模型：

javascript 复制代码

{

  "network_zones": [

    {

      "name": "INTERNAL",

      "description": "内部办公网络"

    },

    {

      "name": "DMZ",

      "description": "对外服务区"

    }

  ],

  "security_controls": {

    "firewall": {

      "enabled": true,

      "zone_isolation": true,

      "default_policy": "deny",

      "logging_enabled": true

    },

    "logging": {

      "centralized": true,

      "retention_days": 180

    },

    "access_control": {

      "aaa": true,

      "rbac": true,

      "review_cycle_days": 90

    }

  }

}

这一层的输出，是整个系统中最重要、也最应该被你掌控的部分。

TIPS： 在定义 JSON 对象模型时，security_controls 下的 status 字段不要简单写 true/false，建议写具体的实现机制（如 mechanism: "Stateful Inspection" 或 auth_type: "Radius_OTP"）。这样 LLM 在"翻译"时，能自动联想到"状态检测防火墙"或"双因子鉴别"等合规加分项。

7、合规语义映射：LLM Prompt 的工程化设计

接下来才轮到 LLM 出场。

7.1 为什么 Prompt 必须"工程化"

如果你只是把上面的 JSON 扔给 LLM，说：

"请生成等保三级合规说明"

那你得到的，大概率仍然是泛泛而谈。

LLM 需要被明确告知三件事：

你要对齐的是哪一套规范
你希望输出的结构
每一条结论必须基于哪些事实

7.2 示例：条款级 Prompt 模板

下面是两个个可以直接复用的 Prompt 模板（示意）：

javascript 复制代码

你是一名信息安全合规专家，熟悉等保2.0三级要求。

以下是某企业网络系统的"工程事实对象模型"（JSON格式），

这些内容均为已实施的真实控制。

请你完成以下任务：

1. 针对"边界防护、访问控制、安全审计、身份鉴别"四类控制，

   分别生成对应的等保三级技术措施说明。

2. 每一条说明必须明确：

   - 控制目标

   - 实现方式

   - 可验证证据

3. 禁止引入对象模型中不存在的控制措施。

4. 输出结构需清晰，便于审计人员逐条核对。

工程事实如下：

{{OBJECT_MODEL_JSON}}

这个 Prompt 的关键点在于：

限制自由发挥
强制证据回指
明确输出结构

7.3进阶：生产级的专业合规 Prompt 设计

为了让这篇文章的实操性从"演示级"提升到"生产级"，我们需要一个深度对齐 GB/T 22239-2019（等保2.0标准） 术语体系的增强版 Prompt。

你可以直接将这段 Prompt 存入你的自动化工具（如 LangChain 或 GPTs）中。

javascript 复制代码

Role: 你是一位深耕中国网络安全等级保护（等保）标准 15 年的资深测评专家，擅长将底层网络架构转化为符合测评要求的"定级对象安全技术实现说明"。

Task: 请基于提供的 {{OBJECT_MODEL_JSON}}（工程事实对象模型），严格对照《GB/T 22239-2019 信息安全技术 网络安全等级保护基本要求》第三级（L3）标准，撰写"安全区域边界"与"安全计算环境"的技术实现初稿。

Standard Reference:

    8.1.3 安全区域边界： 边界防护、访问控制、入侵防范、安全审计。
    8.1.4 安全计算环境： 身份鉴别、访问控制、安全审计。

Writing Requirements:

    术语对齐： 必须使用等保标准术语（如"访问控制规则"、"跨越边界的行为"、"非授权访问"）。
    事实回指： 每一段描述必须明确引用 JSON 中的具体参数（例如：引用 default_policy: deny 描述为"默认丢弃所有非授权流量"）。
    三段式结构：
        [控制项名称]（对应标准条款编号）
        [技术实现描述]（描述我们如何通过现有配置满足此要求）
        [核查点/证据支撑]（指明审计员应查看哪个设备的哪部分配置）

Constraint: 严禁捏造 JSON 模型中不存在的设备、功能或逻辑。若某项条款在模型中无对应事实，请标注"待补充完善"。

Input Data: {{OBJECT_MODEL_JSON}}

Output Format: Markdown 结构化文档。

7.4 LLM 输出示例（节选）

在真实测试中，LLM 给出的输出会类似这样：

边界防护控制说明

本系统在网络边界部署防火墙设备，对内部网络与 DMZ 区域进行逻辑隔离。防火墙默认采用拒绝策略，仅允许经授权的业务流量通过。所有跨区域访问行为均启用日志记录，并集中发送至日志服务器保存不少于 180 天。

可验证证据：

防火墙策略配置
日志服务器存储记录

注意：这不是"文学性好"，而是条款结构天然可审。

8、生成"安全基线"而不是"一次性文档"

这一节，是很多人忽略、但对企业最有价值的地方。

8.1 合规输出的两种形态

评估用文档（一次性）
安全基线（长期约束）

真正成熟的企业，第二种比第一种重要得多。

8.2 从 LLM 输出中反推安全基线条目

你可以把 LLM 的条款级输出，进一步结构化为安全基线规则，例如：

javascript 复制代码

boundary_protection:

  - rule: "不同安全区域之间必须通过防火墙隔离"

    evidence:

      - firewall_policy

  - rule: "跨区域访问必须记录日志"

    evidence:

      - traffic_log

这一步，意味着什么？

意味着合规结果，开始反过来约束你的网络工程行为。

8.3 与自动化运维体系的连接点

一旦安全基线是结构化的：

新增策略 → 是否违反基线
关闭日志 → 是否触发告警
账号长期未复核 → 是否违规

合规不再是年终项目，而是日常工程约束。

9、把合规能力接入网络自动化与 AIOps 体系

到目前为止，我们已经完成了三件事：

网络工程事实 → 结构化对象
对象模型 → 合规语义
合规语义 → 安全基线

但如果止步于"生成一份合规初稿"，这套体系仍然只是半成品。

真正的价值，在于 把合规能力嵌入网络工程的日常流水线中。

9.1 合规不是"结果"，而是"约束条件"

传统流程里，合规的位置是这样的：

设计 → 部署 → 运行 → ...... → 合规检查（年终）

而在工程化合规体系中，它应该变成：

设计 →（合规约束）→ 变更 →（合规校验）→ 运行

合规前移，是这套体系能否落地的关键。

9.2 合规对象模型，天然适合作为 AIOps 输入

回看前面的对象模型：

network_zones
security_controls
logging / access_control

这些本质上就是：

可被机器理解的"安全状态向量"

在 AIOps 体系中，它们可以作为：

变更前后差异比对的输入
风险评分模型的特征
自动审计与异常检测的依据

9.3 示例：网络变更的合规前置校验

假设一次变更包含：

新增一条防火墙策略
修改默认策略
临时关闭日志

在自动化流水线中，你可以插入一个简单但极其有效的步骤：

javascript 复制代码

def check_compliance(baseline, new_state):

    violations = []


    if baseline["firewall"]["logging_required"] and not new_state["firewall"]["logging_enabled"]:

        violations.append("防火墙日志被关闭，违反安全基线")


    if baseline["firewall"]["default_policy"] == "deny" and new_state["firewall"]["default_policy"] != "deny":

        violations.append("默认策略被修改")


    return violations

这不是"智能"，但它是工程化合规的起点。

9.4 LLM 在 AIOps 中的进一步作用

当规则变复杂时，LLM 可以承担两类更高级的任务：

变更语义解释
- 把"这次改了什么"翻译成合规影响说明
审计视角输出
- 自动生成"变更对等保条款的影响评估"

注意：LLM 仍然不做判断主体 ，它做的是解释与归因。

10、常见失败模式与真实审计踩坑点

这一节非常现实，也非常重要。

10.1 失败模式一：对象模型过度细化

很多工程师会下意识地：

把所有命令解析出来
试图覆盖所有配置细节

结果是：

模型复杂
难以维护
合规反而更难做

记住：合规只关心"控制是否存在"，而非"实现是否完美"。

10.2 失败模式二：让 LLM"补全不存在的控制"

这是最危险的一类问题。

如果 Prompt 没有限制，LLM 很容易：

自动"假设"存在某些安全措施
使用行业通用表述进行填充

在真实审计中，这种内容一旦被追问：

"证据在哪里？"

就会直接翻车。

10.3 失败模式三：合规输出不可回指

审计人员真正关心的是：

"你这句话，是从哪来的？"

如果你的合规说明无法回指到：

某个对象
某条策略
某类日志

那这份文档注定只能内部自用。

10.4 一个真实世界的经验判断

在真实项目中，我给出的经验标准是：

任何一条合规描述，如果不能在 5 分钟内定位到工程证据，
那它就是不合格的。

11、为什么这是"网络架构师级能力"

最后这一节，我们回到人本身。

11.1 初级工程师关注"怎么配"

命令
参数
功能

11.2 高级工程师关注"怎么稳定"

冗余
收敛
可运维性

11.3 架构师必须关注"怎么被验证"

是否符合规范
是否可审计
是否可持续演进

合规能力，本质上是"工程可被外部验证的能力"。

11.4 LLM 改变的不是技术，而是"能力边界"

在没有 LLM 之前：

懂网络的人 ≠ 懂合规
两者之间靠人工桥接

而现在：

网络工程事实可以被结构化
合规语义可以被自动映射
架构师可以把精力放在"设计正确的对象模型"上

这不是"写文档更快"，而是工程能力被正式外显。

总结：从"合规任务"到"工程能力"

回顾整篇，我们做的不是教你：

怎么写等保文档
怎么应付审计

而是系统性地回答了一个问题：如何把网络工程事实，转化为可审计、可复用、可演进的制度语言。

这件事一旦成立：

合规不再是年底的负担
文档不再依赖个人经验
网络工程开始具备"制度级表达能力"

LLM 在其中的角色很清晰：

不是决策者，不是替代者，而是翻译器与放大器。

而真正决定质量的，仍然是：

你如何抽象工程事实
你如何定义对象边界
你是否理解合规的真实诉求

这正是网络工程进入"后 AI 时代"后，架构师的核心能力之一。

（文：陈涉川）

2025年12月22日