Python网络请求库,从 requests 到 httpx

前言

如果说 Python 有哪个库改变了互联网开发的门槛,requests 绝对榜上有名。

它用极简的 API 终结了 urllib2 那个混乱的时代。

直到今天,requests.get(url) 依然是很多程序员下意识写出的第一行爬虫代码。

但随着 Python 异步生态(Asyncio)的全面爆发,以及 HTTP/2 协议的普及,这个诞生于 2011 年的老兵开始显露疲态。

PS:为什么 AI 时代还要亲自钻研新技术?

因为 AI 的底色是"过去"。

如果你不掌握先进的工具,AI 就会用它的"经验惯性"把你留在旧时代。

只有你懂新东西,才能指挥 AI 写出更现代的代码。

AI 的本质是"概率模型",它更倾向于给出训练数据中最常见、最保守的方案(往往也就是旧方案)

HttpX

httpx 并不是要推翻 requests,而是要完成它的现代化改造。它的核心口号是:"几乎完全兼容 Requests API,但原生支持异步。"

新项目切换到 httpx 的理由:

  • 原生异步支持: 在处理成千上万个 API 调用时,同步的 requests 会让你的程序在等待网络 IO 时"死掉"。而 httpx 配合 async/await,可以在一秒钟内并发处理极高密度的请求,而不消耗多余的线程资源。
  • 支持 HTTP/2: 相比 HTTP/1.1,HTTP/2 支持多路复用。这意味着在同一个连接上可以并行发送多个请求,大幅降低了延迟。
  • 严格的超时管理: requests 默认永不超时,这在生产环境中是极其危险的。而 httpx 默认开启超时检查,更加符合现代微服务的健壮性要求。

例子

如果你熟悉 requests,迁移到 httpx 的成本几乎为零。

同步写法对比(几乎一致)

python 复制代码
# Requests
import requests
resp = requests.get("https://api.github.com/events")

# HTTPX
import httpx
resp = httpx.get("https://api.github.com/events")

异步写法

python 复制代码
import httpx
import asyncio

async def fetch_tech_news():
    async with httpx.AsyncClient() as client:
        # 同时发起多个请求,效率起飞
        tasks = [client.get(f"https://news.com/api/{i}") for i in range(10)]
        responses = await asyncio.gather(*tasks)
        return [r.json() for r in responses]

asyncio.run(fetch_tech_news())

对比

特性 Requests HTTPX
异步支持 ❌ (需借助线程池) 原生支持 (Async/Await)
HTTP/2 支持
API 友好度 极高 极高 (兼容 Requests)
类型提示 一般 完善 (完美契合 IDE)
适用场景 简单脚本、小型爬虫 Web 异步框架、高并发采集、现代化工程

小结

异步虽然好用,但有些坑:

  • httpxAsyncClient 最好使用 async with 上下文管理器,否则容易造成连接泄露。
  • 在 Windows 环境下使用异步 loop 要额外注意(如 SelectorEventLoop 的限制)
相关推荐
Li emily6 小时前
解决了加密货币api多币种订阅时的数据乱序问题
人工智能·python·api·fastapi
2301_781571426 小时前
Golang格式化输出占位符都有什么_Golang fmt占位符教程【通俗】
jvm·数据库·python
asdzx676 小时前
使用 Python 为 PDF 添加页码 (详细教程)
python·pdf·页码
AI技术控7 小时前
《Transformers are Inherently Succinct》论文解读:从“能表达什么”到“多紧凑地表达”
人工智能·python·深度学习·机器学习·自然语言处理
金融大 k9 小时前
Python 全球指数监控面板:TickDB + REST + WebSocket 完整方案
python·websocket
啊哈哈121389 小时前
系统设计复盘:为什么 Agent 的 ReAct 循环必须内嵌确定性保护层——以 FitMind 健康助手的路由与步骤控制为例
人工智能·python·react
一颗牙牙10 小时前
安装mmcv
开发语言·python·深度学习
大数据魔法师10 小时前
Streamlit(二)- Streamlit 架构与运行机制
python·web
m0_4708576411 小时前
PHP怎么实现工厂模式_Factory模式编写指南【指南】
jvm·数据库·python
大数据魔法师11 小时前
Streamlit(三)- Streamlit 多页面应用开发
python·web