【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
码海扬帆:前端探索之旅3 小时前
深度定制 uni-combox:新增功能详解与实战指南
前端·vue.js·uni-app
xqqxqxxq3 小时前
Java AI智能P图工具技术笔记
java·人工智能·笔记
谷雨不太卷3 小时前
进程的状态码
java·前端·算法
打小就很皮...3 小时前
基于 Python + LangChain + RAG 的知识检索系统实战
前端·langchain·embedding·rag
顾温3 小时前
default——C#/C++
java·c++·c#
BJ-Giser4 小时前
Cesium 烟雾粒子特效
前端·可视化·cesium
空中海4 小时前
02 ArkTS 语言与工程规范
java·前端·spring
楚国的小隐士4 小时前
在AI时代,如何从0接手一个项目?
java·ai·大模型·编程·ai编程·自闭症·自闭症谱系障碍·神经多样性
YJlio4 小时前
7.4.5 Windows 11 企业网络连接与网络重置实战:远程访问、本地策略与故障恢复
前端·chrome·windows·python·edge·机器人·django
yaki_ya4 小时前
yaki-C语言:从概念基础到内存解析---数组(array)完全指南
java·c语言·算法