【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
WYiQIU10 分钟前
11月面了7.8家前端岗,兄弟们12月我先躺为敬...
前端·vue.js·react.js·面试·前端框架·飞书
谢尔登13 分钟前
简单聊聊webpack摇树的原理
运维·前端·webpack
ZHE|张恒16 分钟前
Spring Bean 生命周期
java·spring
娃哈哈哈哈呀1 小时前
formData 传参 如何传数组
前端·javascript·vue.js
zhu_zhu_xia2 小时前
vue3+vite打包出现内存溢出问题
前端·vue
tsumikistep2 小时前
【前后端】接口文档与导入
前端·后端·python·硬件架构
q***38512 小时前
SpringCloud实战十三:Gateway之 Spring Cloud Gateway 动态路由
java·spring cloud·gateway
行走的陀螺仪2 小时前
.vscode 文件夹配置详解
前端·ide·vscode·编辑器·开发实践
小白学大数据2 小时前
Python爬虫伪装策略:如何模拟浏览器正常访问JSP站点
java·开发语言·爬虫·python
2503_928411563 小时前
11.24 Vue-组件2
前端·javascript·vue.js