【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
侠客行031718 小时前
Mybatis连接池实现及池化模式
java·mybatis·源码阅读
蛇皮划水怪18 小时前
深入浅出LangChain4J
java·langchain·llm
子兮曰18 小时前
OpenClaw入门:从零开始搭建你的私有化AI助手
前端·架构·github
吴仰晖18 小时前
使用github copliot chat的源码学习之Chromium Compositor
前端
1024小神18 小时前
github发布pages的几种状态记录
前端
老毛肚20 小时前
MyBatis体系结构与工作原理 上篇
java·mybatis
风流倜傥唐伯虎20 小时前
Spring Boot Jar包生产级启停脚本
java·运维·spring boot
不像程序员的程序媛21 小时前
Nginx日志切分
服务器·前端·nginx
Yvonne爱编码21 小时前
JAVA数据结构 DAY6-栈和队列
java·开发语言·数据结构·python
Re.不晚21 小时前
JAVA进阶之路——无奖问答挑战1
java·开发语言