一问读懂并了解HTTP代理的基本原理

代理分类

  • 正向代理:代理客户端

  • 反向代理:代理服务器,cdn雏形

  • 透明代理:代理客户端

三种代理模式概览
详细对比表

通过curl分析HTTP代理

cpp 复制代码
curl -x https://127.0.0.1:31181 https://httpbin.org/get?abc=123
  • 正常访问httpbin.org

  • 通过代理访问httpbin.org

通过抓包分析,两个包的请求行分别是/get?abc=123http://httpbin.org/get?abc=123。所以通过请求行,可以很清楚的知道客户端请求的目的url。

下面是代理服务伪代码:

cpp 复制代码
#通过代理,访问目的地址
if url.startwith('http'){
	#获取headers
	#获取cookies
	#获取url
	#检查授权
	if check_auth(){
		resp = request(url,heders,cookies)
		retrun resp
	}
	else{
		#授权失败
		return 403;//forbidden
	}
}

此时一个简单的HTTP代理即可完成。至于更多细节,例如请求头是否包含真实客户机IP等细节处理,根据实际业务需求处理即可。

通过浏览器代理分析

发现浏览器并未遵守上述规则,但是都有一个共同点:HOST,始终是目标HOST,所以代理服务进一步优化:

cpp 复制代码
#通过代理,访问目的地址
{
	#获取请求头的HOST 生成完整的URL
	#如果状态行的URL包含HOST(eg:curl 代理),则直接使用URL,如果不包含则从请求头获取HOST,拼接URL
	#获取cookies
	#检查授权
	if check_auth(){
		resp = request(url,heders,cookies)
		retrun resp
	}
	else{
		#授权失败
		return 403;//forbidden
	}
}
HTTP 代理之tunnel

HTTP tunnel,即CONNECT 方法,通过代理服务建立一条TCP通道,实现客户机和后端服务通讯。当Tunnel建立之后,代理服务只维护通道链接,并不需要解析包,此时传送数据可以是任何数据流,不在受HTTP协议限制。

cpp 复制代码
CONNECT httpbin.org:80 HTTP/1.1
Host: httpbin.org:80
Proxy-Authorization: basic *
相关推荐
折哥的程序人生 · 物流技术专研2 小时前
Java面试85题图解版 · 特别篇:2026后端高频面试题复盘(算法底层逻辑+高并发架构设计全解析,附Java实战代码)
java·网络·数据库·算法·面试
专注VB编程开发20年2 小时前
c#Modbus上位机开发-一次读10个地址和100个地址速度一样
网络·网络协议·tcp/ip
2601_961963385 小时前
技术解剖:哈希值、区块链与CA认证如何守护电子合同安全?
网络·人工智能·安全·区块链·智能合约·政务
2601_961963385 小时前
从“电子化”到“自动化”:2026年智能合约与电子合同融合的技术逻辑与法律适配
网络·人工智能·区块链·智能合约·政务
不吃土豆的马铃薯6 小时前
C++ 高性能网络缓冲区 Buffer 源码解析
linux·服务器·开发语言·网络·c++
dog2507 小时前
网络可用性,扩展性,性能的统计本质
网络
嵌入式-老费7 小时前
esp32开发与应用(再谈wifi的使用)
网络·智能路由器
米丘7 小时前
HTTP/3 传输层 QUIC 协议
网络协议·http3
YJlio8 小时前
《Sysinternals实战指南》16.5 Ctrl2Cap 工具详解:把 Caps Lock 变成 Ctrl 的键盘改造与回退方法
linux·运维·服务器·网络·python·学习·计算机外设
wangxixi5228 小时前
OTN 以太网业务接入全流程详解
网络