【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
tkevinjd几秒前
IO流3(字符流)
java
不吃香菜5671 分钟前
SpringBoot 与 SpringCloud用法和区别
java
李少兄5 分钟前
简单讲讲 SVG:前端开发中的矢量图形
前端·svg
这是程序猿5 分钟前
基于java的SpringBoot框架医院药品管理系统
java·开发语言·spring boot·后端·spring·医院药品管理系统
前端小万6 分钟前
告别 CJS 库加载兼容坑
前端·前端工程化
恋猫de小郭6 分钟前
Flutter 3.38.1 之后,因为某些框架低级错误导致提交 Store 被拒
android·前端·flutter
tkevinjd9 分钟前
IO流4(小练习)
java·io流
Vic1010110 分钟前
PostgreSQL 中序列(bigserial 和手动序列)的使用与注意事项
java·大数据·数据库·postgresql
JarvanMo10 分钟前
Flutter 需要 Hooks 吗?
前端
Seven9710 分钟前
数据结构-堆
java