Python html 库用法详解

html 是 Python 的标准库之一,主要用于处理 HTML 相关的编码和解码操作。它提供了两个核心函数:escape()unescape()

基本功能

1、html.escape() - HTML 编码

将特殊字符转换为 HTML 实体,防止 XSS 攻击或确保 HTML 正确显示

python 复制代码
import html

text = '<script>alert("XSS")</script>'
escaped = html.escape(text)
print(escaped)
# 输出: &lt;script&gt;alert(&quot;XSS&quot;)&lt;/script&gt;

默认转义的字符:

  • <&lt;

  • >&gt;

  • &&amp;

  • "&quot;

可选参数:

python 复制代码
html.escape(text, quote=False)  # 不转义引号(")

2、html.unescape() - HTML 解码

将 HTML 实体转换回普通字符。

python 复制代码
import html

escaped_text = "&lt;div&gt;Hello &amp; Welcome&lt;/div&gt;"
clean_text = html.unescape(escaped_text)
print(clean_text)
# 输出: <div>Hello & Welcome</div>
相关推荐
Robot侠6 小时前
极简LLM入门指南4
大数据·python·llm·prompt·提示工程
小浣熊熊熊熊熊熊熊丶6 小时前
《Effective Java》第25条:限制源文件为单个顶级类
java·开发语言·effective java
啃火龙果的兔子6 小时前
JDK 安装配置
java·开发语言
星哥说事6 小时前
应用程序监控:Java 与 Web 应用的实践
java·开发语言
等....7 小时前
Miniconda使用
开发语言·python
zfj3217 小时前
go为什么设计成源码依赖,而不是二进制依赖
开发语言·后端·golang
醇氧7 小时前
org.jetbrains.annotations的@Nullable 学习
java·开发语言·学习·intellij-idea
Java&Develop7 小时前
Aes加密 GCM java
java·开发语言·python
weixin_462446237 小时前
使用 Go 实现 SSE 流式推送 + 打字机效果(模拟 Coze Chat)
开发语言·后端·golang
JIngJaneIL7 小时前
基于springboot + vue古城景区管理系统(源码+数据库+文档)
java·开发语言·前端·数据库·vue.js·spring boot·后端