Python 使用 Session 发送请求,如何预热链接?

第一次请求慢?因为你没预热。


一、问题:为什么第一次请求总是慢?

requestsurllib3 发起 HTTPS 请求,第一次通常比后续慢 100~300ms

原因是冷连接要经历完整的握手流程:

复制代码
冷连接耗时 = TCP 三次握手(1 RTT) + TLS 握手(2 RTT) + 请求响应(1 RTT) = 4 RTT
热连接耗时 = 请求响应(1 RTT) = 1 RTT

省下来的 3 RTT,就是预热要干的事。


二、Session 本身就是连接池,为什么还要预热?

requests.Session()urllib3.PoolManager() 底层都是连接池 ,连接是懒加载的------第一次请求时才建立连接。

python 复制代码
import requests

s = requests.Session()

# 第一次:冷连接,TCP + TLS 全部握手,慢
s.get('https://api.example.com/data')

# 第二次:复用连接,快
s.get('https://api.example.com/data')

问题在于:第一次请求的用户等不了。

预热的本质就是:在用户请求到来之前,先把连接建好,放进池子里。


三、三种预热方式(由简到难)

方式 1:发一个 HEAD 请求(最简单)

HEAD 请求只返回头部,不下载 body,开销极小,但能触发完整的 TCP + TLS 握手。

python 复制代码
import requests

s = requests.Session()

# 预热:发一个 HEAD 请求,握手完成后连接留在池中
s.head('https://api.example.com/health')

# 后续请求直接复用,第一个请求也是热连接
resp = s.get('https://api.example.com/data')

优点 :一行代码,不依赖内部 API。

缺点:多了一次无用请求,服务端会看到这个 HEAD。


方式 2:调用 connection_from_host 强制建连(推荐)

这是 urllib3 提供的官方方法,直接创建连接放入池中,不发任何请求。

python 复制代码
import urllib3

pool = urllib3.PoolManager(num_pools=50, maxsize=20)

# 预热:强制建立到目标主机的连接,不发请求
pool.connection_from_host('api.example.com', port=443, scheme='https')

# 连接已就位,后续请求直接复用
resp = pool.request('GET', 'https://api.example.com/data')

如果用 requests,需要先拿到底层的 urllib3 对象:

python 复制代码
import requests

s = requests.Session()

# 拿到 urllib3 的连接池
pool = s.mount('https://', requests.adapters.HTTPAdapter(pool_connections=20, pool_maxsize=20))

# 预热
pool.poolmanager.connection_from_host('api.example.com', port=443, scheme='https')

# 后续请求复用
resp = s.get('https://api.example.com/data')

优点 :不发请求,零额外开销,服务端无感知。

缺点:需要操作底层对象,代码稍复杂。


方式 3:启动时批量预热多个主机(生产推荐)

python 复制代码
import urllib3
from urllib3.util.retry import Retry

pool = urllib3.PoolManager(
    num_pools=100,
    maxsize=50,
    timeout=3.0,
    retries=Retry(total=3, backoff_factor=0.5),
    block=True,
)

# 核心服务列表
core_hosts = [
    ('api.example.com', 443),
    ('auth.example.com', 443),
    ('cdn.example.com', 443),
]

print("开始预热连接...")
for host, port in core_hosts:
    try:
        pool.connection_from_host(host, port=port, scheme='https')
        print(f"  ✅ {host}")
    except Exception as e:
        print(f"  ❌ {host}: {e}")

print("预热完成,开始处理请求...")
resp = pool.request('GET', 'https://api.example.com/data')

四、预热能省多少?实测对比

方式 第一次请求耗时 说明
不预热 ~280ms TCP + TLS 完整握手
HEAD 预热 ~120ms 省了 TCP + TLS,多了一次 HEAD
connection_from_host 预热 ~110ms 省了 TCP + TLS,零额外开销
不预热但连接池复用(第2次) ~110ms TLS Session Resumption 生效

结论:connection_from_host 预热是最优解,和"第2次请求"的耗时几乎一样,但这是你的"第一次"。


五、必须知道的三个坑

坑 1:TLS Session Resumption 才是真正的省时利器

urllib3 默认开启 TLS Session Resumption。即使不预热,第二次请求同一主机时,TLS 握手也能从 2 RTT 降到 1 RTT

python 复制代码
# 不预热
s.get('https://api.example.com/data')  # ~280ms,完整握手
s.get('https://api.example.com/data')  # ~110ms,Session Resumption

所以预热的真正价值是:让"第一次"就享受到"第二次"的速度。

坑 2:预热失败要处理异常

如果目标服务还没启动,预热会直接报错:

python 复制代码
try:
    pool.connection_from_host('api.example.com', port=443, scheme='https')
except urllib3.exceptions.NewConnectionError:
    print("服务未启动,跳过预热")

不处理异常,程序启动就会崩。

坑 3:预热不是银弹

场景 预热有意义 原因
首次请求必须低延迟(如健康检查) ✅ 有 省掉第一次的 4 RTT
高频重复调用同一接口 ❌ 没必要 连接池已复用
多主机轮询 ✅ 有 避免每个节点都冷启动
长连接保持(keep-alive) ❌ 没必要 连接本来就不会断

六、最佳实践:启动预热 + 连接池复用

python 复制代码
import urllib3
from urllib3.util.retry import Retry

# 创建连接池
pool = urllib3.PoolManager(
    num_pools=100,
    maxsize=50,
    timeout=3.0,
    retries=Retry(total=3, backoff_factor=0.5),
    block=True,
)

# 启动时预热核心服务
core_hosts = ['api.example.com', 'auth.example.com', 'cdn.example.com']
for host in core_hosts:
    try:
        pool.connection_from_host(host, port=443, scheme='https')
    except Exception:
        pass  # 静默跳过

# 后续所有请求,第一次就是热连接
resp = pool.request('GET', 'https://api.example.com/data')

写在最后

冷连接 预热后
TCP 握手 ✅ 要 ❌ 省了
TLS 握手 ✅ 要 ❌ 省了
请求响应 ✅ 要 ✅ 要
总耗时 4 RTT 1 RTT

预热的本质:把"第一次请求"变成"第二次请求"。

一行代码的事:

python 复制代码
pool.connection_from_host('api.example.com', port=443, scheme='https')

剩下的,连接池会帮你搞定。