java替换html中的标签

实现方法

通过正则表达式统一替换:<[^>]+>

实现过程

java 复制代码
import re

text = '''
<!DOCTYPE html>
<html>
<head>
    <title>示例页面</title>
</head>
<body>
    <h1>欢迎来到示例页面</h1>
    <p>这是一个段落。</p>
    <div>
        <p>这是在一个<div>标签内的段落。</p>
    </div>
    <ul>
        <li>列表项 1</li>
        <li>列表项 2</li>
        <li>列表项 3</li>
    </ul>
</body>
</html>
'''

# 使用正则表达式清除HTML标签
cleaned_text = re.sub(r'<[^>]+>', '', text)

print(cleaned_text)
相关推荐
天天摸鱼的java工程师3 分钟前
八年 Java 开发手敲:SpringBoot+SpringSecurity+JWT 实战,前后分离权限注解落地就能跑
java·后端
冰淇淋@5 分钟前
idea启动项目报错java: OutOfMemoryError: insufficient memory
java·ide·intellij-idea
techzhi7 分钟前
this view is read-only (IntelliJ IDEA)
java·ide·intellij-idea
技术小丁8 分钟前
使用 HTML + JavaScript 实现酒店订房日期选择器(附完整源码)
前端·javascript
编程学委9 分钟前
Idea(2023版)使用Svn
java·svn·intellij-idea
hashiqimiya9 分钟前
harmonyos的鸿蒙的跳转页面的部署
开发语言·前端·javascript
qianbailiulimeng9 分钟前
IDEA + Spring Boot 的三种热加载方案
java·后端
王元_SmallA10 分钟前
网卡驱动架构以及源码分析
java·后端
零基础的修炼19 分钟前
Linux---序列化与反序列化
java·开发语言
向日葵同志4433019 分钟前
使用@univerjs纯前端渲染excel, 显示图片、链接、样式
前端·react.js·excel