「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号: 字符实体为
"
,对应的字符是"
。 - 单引号: 字符实体为
'
,对应的字符是'
。 - 与符号: 字符实体为
&
,对应对的字符是&
。 - 大于号: 字符实体为
>
,对应的字符是>
。 - 小于号: 字符实体为
<
,对应的字符是<
。 - 斜线号: 字符实体为
⁄
,对应的字符是/
。
给你输入字符串 text
,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。
示例 1:
输入:text = "& is an HTML entity but &ambassador; is not."
输出:"& is an HTML entity but &ambassador; is not."
解释:解析器把字符实体 & 用 & 替换
示例 2:
输入:text = "and I quote: "...""
输出:"and I quote: \"...\""
示例 3:
输入:text = "Stay home! Practice on Leetcode :)"
输出:"Stay home! Practice on Leetcode :)"
示例 4:
输入:text = "x > y && x < y is always false"
输出:"x > y && x < y is always false"
示例 5:
输入:text = "leetcode.com⁄problemset⁄all"
输出:"leetcode.com/problemset/all"
思路一:模拟题意(哈希表替换)
c++解法
cpp
class Solution {
public:
string entityParser(string s) {
map<string, char> mp;
mp["quot"] = '\"';
mp["apos"] = '\'';
mp["amp"] = '&';
mp["gt"] = '>';
mp["lt"] = '<';
mp["frasl"] = '/';
string ans = "";
int i = 0, j = 0, n = s.size();
while (i < n) {
if (s[i] != '&') {
ans += s[i];
i++;
j++;
} else {
j = i;
while (j < n && s[j] != ';') ++j;
string t = s.substr(i + 1, j - i - 1);
if (mp.find(t) == mp.end()) {
ans += s[i];
++i, ++j;
continue;
}
ans += mp[t];
i = j + 1;
}
}
return ans;
}
};
分析:
本题考察对字符串的替换,可直接使用replace进行替换,也可将对应字符存入哈希表中,一旦读取到对应字符串则将其替换为哈希表中对应字符串
总结:
利用哈希表可解决,replaceall更加直接