如何还原 HTTP 请求日志中的 URL 编码参数?详解 %40 到 @

在记录HTTP请求的日志中出现了这样的情况:

python 复制代码
2024-11-20 11:12:49 INFO network_request gz_login 96  Body: countryAbbr=CN&countryCode=86&email=1222405567%40qq.com&password=12354e50456db124f9f34e2789308733&type=1

出现这种情况的原因是:%40 是 URL 编码后的 @ 符号,说明请求体中的参数被编码后记录下来了。这是因为在 HTTP 请求中,某些特殊字符(如 @, &, =)会被 URL 编码以确保安全性。但是看着不直观,如果有其他特殊符号可能就不知道是什么意思了。

解决这个问题可以使用Python 的 urllib.parse.unquote 函数,将 URL 编码的内容解码为原始格式

python 复制代码
import logging
from urllib.parse import unquote

logger = logging.getLogger(__name__)

def gz_login(pm):
    # 发送请求
    rsp = requests.post(url, headers=HEADERS, data=data, timeout=(10, 10), verify=False)
    rsp.raise_for_status()

    # 日志记录前对请求体解码
    decoded_body = unquote(rsp.request.body.decode('utf-8') if isinstance(rsp.request.body, bytes) else rsp.request.body)

    logger.info("==== HTTP Request ====")
    logger.info(f"Body (decoded): {decoded_body}")

rsp.request.body

rsp 是 requests 模块的响应对象。

rsp.request 表示与该响应关联的请求对象。

rsp.request.body 是请求体的内容,可能是二进制字节(bytes)格式或字符串(str)格式。

if isinstance(rsp.request.body, bytes)

检查 rsp.request.body 是否为字节类型。

如果是字节类型,则需要先解码为字符串。

rsp.request.body.decode('utf-8')

对字节类型的 body 使用 UTF-8 编码进行解码,得到一个字符串。

else rsp.request.body

如果 body 已经是字符串类型,直接使用它。

unquote(...)

对字符串中的 URL 编码字符进行解码。

例如,%40 会被解码为 @,%20 会被解码为空格。

即,如果 rsp.request.body 是字节类型,先解码为字符串;如果是字符串,直接使用。

然后对该字符串进行 URL 解码,得到原始的请求体内容。

这样做的好处是:

1、提高可读性

URL 编码后数据包含 %XX 格式的转义字符,解码后更直观易读。

2、调试方便

在记录日志或调试时,可以直接打印出解码后的请求体内容。

相关推荐
2301_809051148 小时前
Linux 网络编程 学习笔记
linux·网络·学习
风吹夏回8 小时前
Python 全局异常处理:从“满屏 try-except”到优雅兜底
开发语言·python
小熊Coding9 小时前
Python爬取当当网二手图书项目实战!
开发语言·爬虫·python·beautifulsoup·requests·二手图书
秋99 小时前
Java项目运行5天左右自动宕机:系统性定位与解决方案
java·开发语言·python
小江的记录本9 小时前
【JVM虚拟机】垃圾回收GC:垃圾收集器:CMS:核心原理、回收流程、优缺点、废弃原因(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·spring·面试·maven
田里的水稻10 小时前
OE_ubuntu26.04与宿主机之间复制粘贴内容
人工智能·python·机器人
星恒讯工业路由器10 小时前
Wi‑Fi DCM 双载波调制解析
网络·信息与通信·wifi7·wifi6·wi‑fi dcm 双载波调制
jiayong2311 小时前
02 创建虚拟环境
python
旺仔来了11 小时前
不联网的Linux下部署python环境
linux·开发语言·python
小江的记录本11 小时前
【JVM虚拟机】垃圾回收GC:垃圾回收算法:标记-清除、标记-复制、标记-整理、分代收集(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·算法·安全·面试