Python html 库用法详解

html 是 Python 的标准库之一,主要用于处理 HTML 相关的编码和解码操作。它提供了两个核心函数:escape()unescape()

基本功能

1、html.escape() - HTML 编码

将特殊字符转换为 HTML 实体,防止 XSS 攻击或确保 HTML 正确显示

python 复制代码
import html

text = '<script>alert("XSS")</script>'
escaped = html.escape(text)
print(escaped)
# 输出: &lt;script&gt;alert(&quot;XSS&quot;)&lt;/script&gt;

默认转义的字符:

  • <&lt;

  • >&gt;

  • &&amp;

  • "&quot;

可选参数:

python 复制代码
html.escape(text, quote=False)  # 不转义引号(")

2、html.unescape() - HTML 解码

将 HTML 实体转换回普通字符。

python 复制代码
import html

escaped_text = "&lt;div&gt;Hello &amp; Welcome&lt;/div&gt;"
clean_text = html.unescape(escaped_text)
print(clean_text)
# 输出: <div>Hello & Welcome</div>
相关推荐
旧时光巷1 小时前
【机器学习③】 | CNN篇
人工智能·pytorch·python·机器学习·cnn·卷积神经网络·lenet-5
李永奉1 小时前
C语言-指针初级(指针定义、指针的作用、指针的计算、野指针、悬空指针、void类型指针)
c语言·开发语言
Full Stack Developme1 小时前
Java 日期时间处理:分类、用途与性能分析
java·开发语言·数据库
amazinging1 小时前
北京-4年功能测试2年空窗-报培训班学测开-第六十六天
python·学习·面试
2301_793086875 小时前
JVM 01 运行区域
java·开发语言
愤怒的小鸟~~~5 小时前
c语言创建的一个队列结构(含有这个头指针和这个尾指针的结构具有一定的参考价值)
c语言·开发语言·算法
叫我:松哥6 小时前
python案例:基于python 神经网络cnn和LDA主题分析的旅游景点满意度分析
人工智能·python·神经网络·数据挖掘·数据分析·cnn·课程设计
2202_756749697 小时前
01 基于sklearn的机械学习-机械学习的分类、sklearn的安装、sklearn数据集及数据集的划分、特征工程(特征提取与无量纲化、特征降维)
人工智能·python·机器学习·分类·sklearn
鹿野素材屋7 小时前
C#中对于List的多种排序方式
开发语言·c#
whxnchy7 小时前
C++刷题 - 7.27
开发语言·c++