Python html 库用法详解

html 是 Python 的标准库之一,主要用于处理 HTML 相关的编码和解码操作。它提供了两个核心函数:escape()unescape()

基本功能

1、html.escape() - HTML 编码

将特殊字符转换为 HTML 实体,防止 XSS 攻击或确保 HTML 正确显示

python 复制代码
import html

text = '<script>alert("XSS")</script>'
escaped = html.escape(text)
print(escaped)
# 输出: &lt;script&gt;alert(&quot;XSS&quot;)&lt;/script&gt;

默认转义的字符:

  • <&lt;

  • >&gt;

  • &&amp;

  • "&quot;

可选参数:

python 复制代码
html.escape(text, quote=False)  # 不转义引号(")

2、html.unescape() - HTML 解码

将 HTML 实体转换回普通字符。

python 复制代码
import html

escaped_text = "&lt;div&gt;Hello &amp; Welcome&lt;/div&gt;"
clean_text = html.unescape(escaped_text)
print(clean_text)
# 输出: <div>Hello & Welcome</div>
相关推荐
CodeCraft Studio22 分钟前
PPT处理控件Aspose.Slides教程:在 C# 中将 PPTX 转换为 Markdown
开发语言·c#·powerpoint·markdown·ppt·aspose·ai大模型
萧鼎1 小时前
深入理解 Python Scapy 库:网络安全与协议分析的瑞士军刀
开发语言·python·web安全
阿拉丁的梦4 小时前
教程1:用vscode->ptvsd-创建和调试一个UI(python)-转载官方翻译(有修正)
开发语言·python
木宇(记得热爱生活)4 小时前
一键搭建开发环境:制作bash shell脚本
开发语言·bash
Cisyam^4 小时前
Go环境搭建实战:告别Java环境配置的复杂
java·开发语言·golang
名难取aaa4 小时前
celery solo acks_late得不到预期
python·celery
IAR Systems5 小时前
在IAR Embedded Workbench for Arm中实现Infineon TRAVEO™ T2G安全调试
开发语言·arm开发·安全·嵌入式软件开发·iar
jayzhang_5 小时前
SPARK入门
大数据·开发语言
蹦极的考拉5 小时前
网站日志里面老是出现{pboot:if((\x22file_put_co\x22.\x22ntents\x22)(\x22temp.php\x22.....
android·开发语言·php
fured5 小时前
[调试][实现][原理]用Golang实现建议断点调试器
开发语言·后端·golang