富文本中去掉 HTML 和 CSS 样式,只保留纯文本

要从富文本中去掉 HTML 和 CSS 样式,只保留纯文本,可以使用以下几种方法:

  1. 纯 JavaScript 方法

你可以使用 JavaScript 的 innerTexttextContent 来提取文本,而忽略 HTML 标签和样式。

javascript 复制代码
function stripHtml(html) {
    var tempDiv = document.createElement("div");
    tempDiv.innerHTML = html;
    return tempDiv.innerText || tempDiv.textContent || "";
}

var richText = "<div style='color: red;'>Hello <b>World</b>!</div>";
var plainText = stripHtml(richText);
console.log(plainText);  // 输出 "Hello World!"

2. 使用正则表达式

可以通过正则表达式去除 HTML 标签。虽然这种方法比较简单,但它可能无法处理一些嵌套标签或特殊的情况,因此需要根据需求进行调整。

javascript 复制代码
function stripHtmlTags(html) {
    return html.replace(/<[^>]*>/g, '');
}

var richText = "<div style='color: red;'>Hello <b>World</b>!</div>";
var plainText = stripHtmlTags(richText);
console.log(plainText);  // 输出 "Hello World!"

3. 使用浏览器的 DOM 解析

可以利用浏览器内置的 DOM 解析能力来处理更复杂的 HTML 内容。

javascript 复制代码
function stripStylesAndHtml(html) {
    var tempDiv = document.createElement("div");
    tempDiv.innerHTML = html;
    
    // 遍历所有元素,移除内联样式
    var elements = tempDiv.getElementsByTagName("*");
    for (var i = 0; i < elements.length; i++) {
        elements[i].removeAttribute("style");
    }
    
    return tempDiv.innerText || tempDiv.textContent || "";
}

var richText = "<div style='color: red;'>Hello <b>World</b>!</div>";
var plainText = stripStylesAndHtml(richText);
console.log(plainText);  // 输出 "Hello World!"
相关推荐
Riesenzahn几秒前
css在页面上画一个正方形,边长为页面宽度的一半
前端·javascript
tommyrunner2 分钟前
Cursor rule文件测试 一秒了解AI行为规则文件
前端·cursor
北京_宏哥7 分钟前
《手把手教你》系列基础篇(九十三)-java+ selenium自动化测试-框架设计基础-POM设计模式实现-上篇(详解教程)
java·前端·selenium
Nu1111 分钟前
weakMap 和 weakSet 原理
前端·面试
顾林海14 分钟前
深入理解 Dart 函数:从基础到高阶应用
android·前端·flutter
比特鹰18 分钟前
桌面端跨端框架调研
前端·javascript·前端框架
Ratten18 分钟前
【JavaScript】---- JS原生的深拷贝API structuredClone 使用详解与注意事项
前端·javascript
DarisX19 分钟前
JupyterLab前端二开基础上手指南
前端
ZZZzh19 分钟前
前端开发浏览器调试方法
前端