目录
urlencode
URL编码也称为百分号编码,用于将URL中的特殊字符转换为安全传输的格式。英文数字一般不编码
特点:
-
使用
%后跟两个十六进制数字表示字符 -
空格编码为
+或%20 -
保留字符(
;/?:@&=+$,)等在不同URL部分有特殊含义 -
其他字符:转换为UTF-8字节序列,然后每个字节用
%XX表示
html实体编码
HTML实体用于表示HTML中的特殊字符,防止与标签混淆。
类型:
-
命名实体:
<表示< -
数字实体:
<或<表示<
常见实体:
| 字符 | 命名实体 | 十进制 | 十六进制 |
|---|---|---|---|
| < | < |
< |
< |
| > | > |
> |
> |
| & | & |
& |
& |
| " | " |
" |
" |
| 空格 | |
  |
  |
Unicode编码
Unicode为世界上所有字符提供唯一编号(码点)
表示方式:
| 环境 | 格式 | 示例 |
|---|---|---|
| JavaScript | \uXXXX(4位)或\u{X...}(1-6位) |
\u6D4B 或 \u{6D4B} |
| Python | \uXXXX 或 \UXXXXXXXX |
\u6d4b |
| HTML | &#xXXXX; 或 &#NNNNN; |
测 或 测 |
| Java | \uXXXX |
\u6D4B |
| C/C++ | \uXXXX 或 \UXXXXXXXX |
\u6D4B |