WebSocket 消息传输：帧格式、掩码机制与代理污染攻击防护

WebSocket 不像 HTTP 那样用 "请求 - 响应报文" 传输数据，而是将所有消息（文本 / 二进制）拆分成帧（Frame） 传输 ------ 哪怕是一条简单的 "你好"，也会被包装成一个帧发送。

帧是 WebSocket 数据传输的最小单位，其格式遵循 RFC 6455 规范，结构如下（按字节顺序）：

字段	位数	核心作用
FIN	1	标识是否为消息的最后一帧：`1`= 最后一帧（完整消息），`0`= 后续还有帧（分片）
RSV1/RSV2/RSV3	1*3	扩展位，默认全 0，仅启用扩展（如压缩）时使用
Opcode	4	帧类型：• `0x0`：延续帧（分片消息的后续帧）• `0x1`：文本帧（UTF-8 数据）• `0x2`：二进制帧• `0x8`：关闭帧• `0x9`：PING 帧• `0xA`：PONG 帧
MASK	1	标识数据是否被掩码：`1`= 客户端发送的帧必须掩码，`0`= 服务器发送的帧不能掩码
Payload length	7/7+16/7+64	负载数据长度：・0-125：直接表示长度・126：后续 2 字节表示长度・127：后续 8 字节表示长度
Masking-key	0/32	掩码密钥：仅 MASK=1 时存在（客户端帧必带），4 字节随机数
Payload data	可变	实际传输的数据（文本 / 二进制），若 MASK=1 需先解掩码

FIN=1：这是完整的 "你好" 消息，没有分片；
Opcode=0x1：这是文本帧，数据是 UTF-8 格式；
MASK=1：客户端发送的帧必须掩码，后续带 4 字节掩码密钥；
Payload length=2："你好" 的 UTF-8 编码是 2 个字节；
Masking-key ：比如随机生成 0x12 0x34 0x56 0x78；
Payload data ："你好" 的 UTF-8 二进制数据（0xE4 0xBD 0xA0 0xE5 0xA5 0xBD？注：实际 "你好" 是 6 字节，此处仅举例），先通过掩码密钥处理后再传输。

掩码的本质是客户端用 4 字节随机密钥，对负载数据做简单的异或（XOR）运算，目的是 "打乱" 数据二进制，防御代理污染攻击。

假设：

比如：

因为代理污染攻击的风险只存在于 "客户端→服务器" 的方向（后文详解），服务器→客户端的帧无需掩码，可减少运算开销。

早期互联网中，大量中间节点（如 HTTP 代理、缓存服务器、反向代理）是为 HTTP 协议设计的 ------ 这些节点会 "无脑" 解析二进制数据，试图识别 HTTP 报文的特征（比如 \r\n、Host:、GET 等），并缓存 / 转发数据。

如果 WebSocket 客户端直接发送未掩码的明文二进制数据，可能会出现：

假设客户端通过 WebSocket 发送一条文本消息："GET /admin HTTP/1.1\r\nHost: hack.com\r\n"（只是普通聊天内容，无攻击意图）：

若没有掩码，这条消息的二进制数据会原封不动通过代理；
代理服务器识别到 GET /admin HTTP/1.1 这个 HTTP 特征，误以为这是一个 HTTP 请求；
代理服务器会缓存 "/admin 路径对应 hack.com 的响应"；
后续其他用户通过该代理访问 http://正常网站/admin 时，代理会返回缓存的 hack.com 内容 ------ 导致正常网站的缓存被污染，用户访问到错误数据。

掩码通过 "随机异或打乱数据二进制"，确保：

你之前的示例代码中，没有手动处理掩码，因为：

客户端（浏览器） ：调用 ws.send("你好") 时，浏览器会自动：
1. 生成 4 字节随机掩码密钥；
2. 对 "你好" 的 UTF-8 数据做掩码运算；
3. 按帧格式封装数据，设置 MASK=1，携带 Masking-key；
4. 发送帧到服务器。
服务端（ws 库） ：收到帧后，会自动用 Masking-key 解掩码，你在 ws.on('message') 中拿到的是还原后的明文 "你好"------ 无需手动处理。

如果通过底层编程（如手动构造帧）发送 MASK=0 的客户端帧，服务器会直接断开连接，并抛出类似 "Received unmasked frame from client" 的错误 ------ 这是协议强制要求。