【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
excel18 分钟前
为什么在 Three.js 中平面能产生“起伏效果”?
前端
excel1 小时前
Node.js 断言与测试框架示例对比
前端
天蓝色的鱼鱼3 小时前
前端开发者的组件设计之痛:为什么我的组件总是难以维护?
前端·react.js
codingandsleeping3 小时前
使用orval自动拉取swagger文档并生成ts接口
前端·javascript
考虑考虑4 小时前
Jpa使用union all
java·spring boot·后端
石金龙4 小时前
[译] Composition in CSS
前端·css
用户3721574261354 小时前
Java 实现 Excel 与 TXT 文本高效互转
java
白水清风4 小时前
微前端学习记录(qiankun、wujie、micro-app)
前端·javascript·前端工程化
Ticnix4 小时前
函数封装实现Echarts多表渲染/叠加渲染
前端·echarts
用户22152044278004 小时前
new、原型和原型链浅析
前端·javascript