1410. HTML 实体解析器
代码仓库地址 : https://github.com/slience-me/Leetcode
个人博客 :https://slienceme.xyz
-
编写一个函数来查找字符串数组中的最长公共前缀。
如果不存在公共前缀,返回空字符串
""
。 -
「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号: 字符实体为
"
,对应的字符是"
。 - 单引号: 字符实体为
'
,对应的字符是'
。 - 与符号: 字符实体为
&
,对应对的字符是&
。 - 大于号: 字符实体为
>
,对应的字符是>
。 - 小于号: 字符实体为
<
,对应的字符是<
。 - 斜线号: 字符实体为
⁄
,对应的字符是/
。
给你输入字符串
text
,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。示例 1:
输入:text = "& is an HTML entity but &ambassador; is not." 输出:"& is an HTML entity but &ambassador; is not." 解释:解析器把字符实体 & 用 & 替换
示例 2:
输入:text = "and I quote: "..."" 输出:"and I quote: \"...\""
示例 3:
输入:text = "Stay home! Practice on Leetcode :)" 输出:"Stay home! Practice on Leetcode :)"
示例 4:
输入:text = "x > y && x < y is always false" 输出:"x > y && x < y is always false"
示例 5:
输入:text = "leetcode.com⁄problemset⁄all" 输出:"leetcode.com/problemset/all"
提示:
1 <= text.length <= 10^5
- 字符串可能包含 256 个ASCII 字符中的任意字符。
- 双引号: 字符实体为
方案1:暴力解
第一种纯暴力解,遍历替换
cpp
class Solution {
public:
string entityParser(string text) {
unordered_map<string, string> myMap = {{""", "\""},
{"'", "\'"},
{"&", "&"},
{">", ">"},
{"<", "<"},
{"⁄", "/"}};
for (const auto &map: myMap){
string searchString = map.first;
string replacementString = map.second;
size_t pos = text.find(searchString); // 找到第一个匹配的位置
// 循环替换所有匹配的内容
while (pos != string::npos) {
text.replace(pos, searchString.length(), replacementString); // 用替换字符串替换匹配字符串
pos = text.find(searchString, pos + replacementString.length()); // 继续找下一个匹配的位置
}
}
return text;
}
};
执行用时分布 744ms 击败11.76%使用 C++ 的用户
消耗内存分布16.37MB 击败90.20%使用 C++ 的用户
方案2
发现没有优化太多,反而超时了
cpp
class Solution {
public:
string entityParser(string text) {
unordered_map<string, string> myMap = {{""", "\""},
{"'", "\'"},
{"&", "&"},
{">", ">"},
{"<", "<"},
{"⁄", "/"}};
for (int i = 0; i < text.length(); ++i){
string temp="&";
if (text[i]=='&'){
if (text[i+1]=='\0' || text[i+1]=='&'){
continue;
}
int indexj = i+1;
while (text[indexj]!=';'){
if (indexj>=text.length()){
break;
}
temp += text[indexj];
indexj+=1;
}
if (indexj>=text.length()){
break;
}
temp += ';';
size_t index = replaceStr(text, myMap, temp);
if (index != -1){
i = index;
}
} else if(text[i]=='\0'){
continue;
}
}
return text;
}
size_t replaceStr(string &text, unordered_map<string, string> &myMap, const string &temp) const {
if(myMap.find(temp) != myMap.end()){
string searchString = myMap.find(temp)->first;
string replacementString = myMap.find(temp)->second;
size_t pos = text.find(searchString); // 找到第一个匹配的位置
// 循环替换所有匹配的内容
text.replace(pos, searchString.length(), replacementString); // 用替换字符串替换匹配字符串
return pos+replacementString.length()-1;
}
return -1;
}
};
超出时间限制
测试用例通过了,但耗时太长。
方案3
最后的优化
cpp
class Solution {
public:
string entityParser(string text) {
string result = "";
int i = 0;
int n = text.length();
while (i < n) {
if (text[i] == '&') {
if (text.substr(i, 6) == """) {
result += "\"";
i += 6;
} else if (text.substr(i, 6) == "'") {
result += "'";
i += 6;
} else if (text.substr(i, 5) == "&") {
result += "&";
i += 5;
} else if (text.substr(i, 4) == ">") {
result += ">";
i += 4;
} else if (text.substr(i, 4) == "<") {
result += "<";
i += 4;
} else if (text.substr(i, 7) == "⁄") {
result += "/";
i += 7;
} else {
result += text[i];
i++;
}
} else {
result += text[i];
i++;
}
}
return result;
}
};
执行用时分布 68ms 击败80.39%使用 C++ 的用户
消耗内存分布 18.54MB 击败35.29%使用 C++ 的用户