【代码库】去除字符串中的 HTML 标签

去除字符串中的 HTML 标签内容,只保留文本内容。

java 复制代码
import java.util.regex.*;

/**
 * 去除字符串中的 HTML 标签内容,只保留文本内容。
 */
public class RemoveHtmlTags {
    public static void main(String[] args) {
        // 原始 HTML 字符串
        String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";

        // 定义要匹配的HTML标签模式
        Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

        // 创建Matcher对象并进行匹配操作
        Matcher matcher = pattern.matcher(html);

        // 将匹配到的HTML标签替换为空格或其他需要的字符
        String result = matcher.replaceAll("");

        System.out.println(result);
    }
}
相关推荐
倾颜1 小时前
从 textarea 到 AI 输入框:用 Tiptap 实现 / 命令、@ 引用和结构化请求
前端·langchain·next.js
kyriewen3 小时前
程序员连夜带团队跑路,省了23万:这AI太贵,真的用不起了
前端·javascript·openai
kyriewen3 小时前
你写的代码没有测试,就像出门不锁门——Jest + Testing Library 从入门到不慌
前端·单元测试·jest
zc.z3 小时前
JAVA实现:纯PCM格式音频转换成BASE64
java·音视频·pcm
mask哥4 小时前
力扣算法java实现汇总整理(上)
java·算法·leetcode
yuzhiboyouye4 小时前
web前端英语面试
前端·面试·状态模式
Aaswk5 小时前
Java Lambda 表达式与流处理
java·开发语言·python
是宇写的啊5 小时前
Spring AOP
java·spring
canonical_entropy5 小时前
下一代低代码渲染框架 nop-chaos-flux 的设计原则
前端·低代码·前端框架
万邦科技Lafite5 小时前
京东item_get接口实战案例:实时商品价格监控全流程解析
java·开发语言·数据库·python·开放api·淘宝开放平台