【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
贾斯汀玛尔斯8 小时前
每天学一个算法--LSM-Tree(Log-Structured Merge Tree)
java·算法·lsm-tree
bitt TRES8 小时前
springboot与springcloud对应版本
java·spring boot·spring cloud
Y001112368 小时前
JavaWeb-end
java·servlet·web
万少8 小时前
Vibe Coding不停歇,移动端 TRAE SOLO 让你用手机也能编程啦
前端·javascript·后端
bzmK1DTbd8 小时前
Git版本控制:Java项目中的分支管理与合并策略
java·开发语言·git
kyriewen119 小时前
WebAssembly:前端界的“外挂”,让C++代码在浏览器里跑起来
开发语言·前端·javascript·c++·单元测试·ecmascript
烛衔溟10 小时前
TypeScript 接口的基本使用 —— 定义对象形状
前端·javascript·typescript
铁皮饭盒10 小时前
成为AI全栈 - 第3课:路由 RESTful Elysia 状态码 设计规范
前端·后端·全栈
顾昂_10 小时前
Web 性能优化完全指南
前端·面试·性能优化
JWASX10 小时前
【RocketMQ 生产者和消费者】- 事务源码分析(1)
java·rocketmq·java-rocketmq