去除字符串中的 HTML 标签内容,只保留文本内容。
java
import java.util.regex.*;
/**
* 去除字符串中的 HTML 标签内容,只保留文本内容。
*/
public class RemoveHtmlTags {
public static void main(String[] args) {
// 原始 HTML 字符串
String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";
// 定义要匹配的HTML标签模式
Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);
// 创建Matcher对象并进行匹配操作
Matcher matcher = pattern.matcher(html);
// 将匹配到的HTML标签替换为空格或其他需要的字符
String result = matcher.replaceAll("");
System.out.println(result);
}
}