Python html 库用法详解

html 是 Python 的标准库之一,主要用于处理 HTML 相关的编码和解码操作。它提供了两个核心函数:escape()unescape()

基本功能

1、html.escape() - HTML 编码

将特殊字符转换为 HTML 实体,防止 XSS 攻击或确保 HTML 正确显示

python 复制代码
import html

text = '<script>alert("XSS")</script>'
escaped = html.escape(text)
print(escaped)
# 输出: &lt;script&gt;alert(&quot;XSS&quot;)&lt;/script&gt;

默认转义的字符:

  • <&lt;

  • >&gt;

  • &&amp;

  • "&quot;

可选参数:

python 复制代码
html.escape(text, quote=False)  # 不转义引号(")

2、html.unescape() - HTML 解码

将 HTML 实体转换回普通字符。

python 复制代码
import html

escaped_text = "&lt;div&gt;Hello &amp; Welcome&lt;/div&gt;"
clean_text = html.unescape(escaped_text)
print(clean_text)
# 输出: <div>Hello & Welcome</div>
相关推荐
大翻哥哥13 分钟前
Python 2025:异步革命与AI驱动下的开发新范式
开发语言·人工智能·python
mark-puls15 分钟前
Qt标签页控件QTabWidget全面指南:创建现代化多页界面
开发语言·qt·设计模式
hhzz21 分钟前
Pythoner 的Flask项目实践-在web页面实现矢量数据转换工具集功能(附源码)
前端·python·flask
Brookty42 分钟前
深入解析Java类加载与实例化流程
java·开发语言·学习
学习的学习者1 小时前
CS课程项目设计19:基于DeepFace人脸识别库的课堂签到系统
人工智能·python·深度学习·人脸识别算法
终焉代码1 小时前
【C++】map与set底层结构——红黑树
开发语言·数据结构·c++
数字化顾问1 小时前
“AMQP协议深度解析:消息队列背后的通信魔法”之核心概念与SpringBoot落地实战
开发语言·后端·ruby
悠哉悠哉愿意1 小时前
【数据结构与算法学习笔记】双指针
数据结构·笔记·python·学习·算法
MoRanzhi12031 小时前
5. Pandas 缺失值与异常值处理
数据结构·python·数据挖掘·数据分析·pandas·缺失值处理·异常值处理
haing20192 小时前
使用matlab进行牛顿迭代求函数极值的方法
开发语言·matlab·牛顿迭代