【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
kyriewen3 分钟前
折腾了半年 AI 编程工作流,最后发现效率瓶颈是桌上那块屏幕
前端·javascript·ai编程
蜗牛前端30 分钟前
codex 全流程开发上线的高颜值礼簿小程序
前端·微信小程序
大龄秃头程序员1 小时前
我在图文流 App 里落地双层缓存、弱网降级与 OOM 治理
前端
老王以为1 小时前
React Renderer 分离的多平台架构
前端·react native·react.js
hunterandroid1 小时前
Kotlin Coroutines 与 Flow:让异步任务更清晰
前端
Bigger2 小时前
从零搭建 AI 代码审查服务:一份前端也能看懂的 Python 学习笔记
前端·ci/cd·ai编程
用户298698530142 小时前
Java 实现 Word 文档加密与权限解除
java·后端
lichenyang4532 小时前
JSAPI、NAPI、Biz、Imp:ASCF Demo 如何真正调用系统能力和 C++ 能力
前端
lichenyang4532 小时前
IPC、JSVM、UIThread、libuv:ASCF 架构图里最容易混的几个词
前端
Yeats_Liao2 小时前
14:Servlet中的页面跳转-Java Web
java·后端·架构