【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
橙淮11 小时前
并发编程(六)
java·jvm
拽着尾巴的鱼儿11 小时前
springboot openfeign 自定义feign 接口重试机制
java·spring boot·后端
kyriewen11 小时前
微软用Go重写TypeScript编译器,速度提升10倍,网友:这是“背叛”还是“救赎”?
前端·typescript·ecmascript 6
白露与泡影11 小时前
2026大厂Java面试题大全!牛客网最新版
java·开发语言
Ceelog11 小时前
久坐党自救指南:屏幕前 8 小时,身体到底在经历什么
前端·后端
西陵12 小时前
Agent 为什么会陷入 Doom Loop?OpenClaw 的破解之道
前端·人工智能·ai编程
Hyyy12 小时前
普通前端续命周报——第2周
前端
EntyIU12 小时前
JVM内存与GC笔记
java·jvm·笔记
wuxinyan12312 小时前
工业级大模型学习之路030:Streamlit 企业级智能体前端工作台
前端·学习·streamlit·智能体
XS03010613 小时前
并发编程 六
java·后端