【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
用户345848285053 分钟前
java中的tomicInteger/AtomicLong介绍
前端·后端
jiayong234 分钟前
Elasticsearch Java 开发完全指南
java·大数据·elasticsearch
一颗宁檬不酸5 分钟前
Vue.js 初学者基础知识点总结 第一弹
前端·javascript·vue.js
321茄子6 分钟前
MySQL 事务隔离性及锁
java·数据库·mysql
xiaoxue..7 分钟前
解析 LocalStorage与事件委托在前端数据持久化中的应用
前端·javascript·面试
Mintopia7 分钟前
「无界」全局浮窗组件设计与父子组件最佳实践
前端·前端框架·前端工程化
杀死那个蝈坦9 分钟前
UV 统计(独立访客统计)
java·jvm·spring·kafka·tomcat·maven
带刺的坐椅11 分钟前
Solon AI 开发学习7 - chat - 四种消息类型及提示语增强
java·ai·llm·solon
济宁雪人12 分钟前
Java安全基础——序列化/反序列化
java·开发语言
1***Q78412 分钟前
后端在微服务中的服务路由
java·数据库·微服务