图解「正向代理」的原理 + 实践应用

这是悟空的第 188 篇原创文章

本文主要内容如下:

在工作中经常和正向代理和反向代理打交道,有必要总结下正向代理的原理和实践应用了。(反向代理安排在下篇吧)

官网:www.passjava.cn

如何理解正向代理

代理(Proxy)服务通常被我们称为正向代理服务,如下图所示:

  • 客户端:图中的客户端我用电脑和手机作为示意,客户端指在计算机网络中与服务器进行通信的一种计算机程序或设备。客户端通常请求服务器提供某种服务,如获取网页、发送电子邮件、下载文件等。客户端与服务器之间的通信通常遵循客户端-服务器模型,其中客户端发出请求,而服务器响应这些请求。
  • 站点:可以理解为网络中的目标服务器,当客户端想要访问目标服务器的资源时,需要通过网络通信才能获取到资源。
  • 正向代理服务器:在客户端和站点之间,起到了一个转发请求的作用。正向代理服务器不支持外部对内部网络的访问请求。正向代理服务器和客户端是紧密联系的,我们工作中用到的 VPN(虚拟专用网络) 就是一种正向代理的方式。
  • 箭头:箭头的方向代表访问的方向。

大白话聊聊正向代理

一位企业老总,他有一位助理小李,当老总想要订火车票时,就会委托小李帮忙订票,当老总想要订酒店时,小李就会负责查找合适的酒店并安排老总入住。助理小李帮老总办了很多事情,也就是代理了一些事情,而助理小李就充当了一个代理服务器的角色。如下图所示:

正向代理的作用

企业可以使用正向代理来增强网络安全、访问控制、性能优化和隐私保护等方面的功能。以下是企业中如何使用正向代理的一些常见场景和方法:

  • 远程办公: 在远程办公环境中,企业可以使用正向代理来帮助员工安全地连接到公司内部网络,访问内部资源,而不必暴露公司的内部网络直接在互联网上。
  • 访问控制和安全性: 企业可以在其网络中部署正向代理服务器,以实施访问控制策略。通过正向代理,可以限制员工访问特定网站或互联网资源,从而减少潜在的网络威胁。这有助于保护企业免受恶意软件、恶意网站和网络攻击的影响。
  • 内容过滤和缓存: 正向代理可以用于过滤和缓存网络内容,以提高性能并减少带宽消耗。代理服务器可以缓存常用的资源,例如网页、图像和视频,从而减少对外部服务器的请求,提高用户体验。
  • 安全审计和监控: 企业可以使用正向代理来监视员工的网络活动,以确保合规性和安全性。代理服务器可以记录访问日志,以便后续的安全审计和监控。
  • 反病毒和恶意软件保护: 正向代理可以用于检测和拦截网络流量中的恶意软件、病毒和恶意链接。这有助于保护企业内部网络免受恶意软件的传播和感染。
  • 隐私保护: 企业可以使用正向代理来保护员工的隐私。代理服务器可以隐藏员工的真实IP地址,从而提高员工的在线隐私。
  • 访问受限资源: 有些企业需要访问特定地理位置或IP受限的互联网资源。正向代理可以用于绕过这些限制,以访问需要的资源。
  • 负载均衡: 企业可以使用正向代理来实现负载均衡,将客户端请求分发到多个服务器,以提高性能和可用性。这对于高流量的企业应用程序和网站非常有用。

企业中如何使用正向代理

在企业中,正向代理工具用于多种场景,以增强网络安全性、访问控制、性能优化和隐私保护。以下是一些常见的正向代理工具和它们在不同场景中的用途:

  • Nginx: Nginx 是一款高性能的反向代理服务器,但也可以配置为正向代理。它通常被用于负载均衡、访问控制和内容缓存。
  • 自建VPN: 一些企业和个人选择自行搭建虚拟私人网络(VPN)来实现正向代理功能。这可以通过使用开源VPN软件如OpenVPN或商业VPN服务来实现。
  • CDN服务: 一些CDN(内容分发网络)服务提供商也提供正向代理功能,以加速访问、缓存内容和提供安全性。
  • Squid: Squid 是一个开源的代理服务器软件,被广泛用于企业和学校网络中。它提供了强大的访问控制、缓存和性能优化功能,常用于网络管理和内容过滤。
  • CCProxy(若快代理服务器): CCProxy 是一款商业代理服务器软件,又称为"若快",它提供了访问控制、带宽控制和网络加速功能。
  • TinyProxy: TinyProxy 是一个轻量级的代理服务器软件,适用于小型网络环境。它的配置相对简单,适合快速搭建正向代理。
  • Glype: Glype 是一个基于Web的代理脚本,可以让用户通过浏览器访问被封锁的网站。它常被用于构建Web代理服务,以绕过互联网审查。

项目中如何使用正向代理

以下是一个 Nginx 的正向代理的配置,

ini 复制代码
http {
    server {
        listen       80;
        server_name  www.passjava.cn;

        location / {
            proxy_pass http://target_server;
            proxy_set_header Host $host;
        }
    }
}

上述配置表明当客户端通过浏览器或其他方式发送请求到 www.passjava.cn 这个域名时,Nginx 将监听 HTTP 请求的端口 80,并将这些请求代理到 target_server 指定的目标服务器。这是一个典型的正向代理配置,用于隐藏客户端的真实 IP 地址,同时将请求转发到其他服务器上。这在一些网络安全和访问控制方面非常有用。

真实场景的一个应用

我们项目中大量使用 Nginx 作为正向代理和反向代理,这里举一个我用 Nginx 作为正向代理的真实案例。

背景

公司生产一些硬件设备,而这些设备在生产的过程中,需要调用我们后台系统的接口,我们后台系统所在的网络和设备的网络并不在同一个网段内,想要实现网络互通,我们在设备和系统之间加了一层正向代理服务器,设备先将请求发送给代理服务器,由代理服务器将请求转发给后台系统。

解决方案

如下图所示:

设备 1 和设备 2 的 IP 在 192.168.1.0/24 IP 地址段内,HTTP 请求先发到代理服务器,然后转发到后台服务器集群的网关地址(192.168.52.123)。

代理服务器上有两个网卡,和设备之间的网络是通的,和服务器集群之间的网络也是通的。这样就能保证设备的请求能够正常发送到系统了。

疑问:为啥不把后台系统的服务器 IP 改成和设备同一网段?

答:问题出在不能保证设备和后台系统在同一局域网内。有的设备是在其他局域网内生产的,即使在同一个网段内,但是是跨局域网的,设备和后台系统也是无法连通的。

完整的 NGINX 配置如下:

正向代理后如何获取真实 IP

另外我们的系统还需要获取设备的真实 IP,这就需要在 Nginx 加上配置:

bash 复制代码
# location 模块中加入以下配置:
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

上述配置可以暴露客户端的真实 IP 地址给目标服务器,特别是 proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; 这两行配置。

让我解释一下这三行配置的含义:

  1. proxy_set_header Host $host;:这一行配置将客户端请求中的 Host 头部信息传递给目标服务器。这是正常的 HTTP 头部信息传递,不涉及客户端 IP 地址。
  2. proxy_set_header X-Real-IP $remote_addr;:这一行配置将客户端的真实 IP 地址作为 X-Real-IP 头部信息传递给目标服务器。这意味着目标服务器可以访问到客户端的真实 IP 地址。
  3. proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;:这一行配置将客户端的 IP 地址添加到 X-Forwarded-For 头部信息中,并传递给目标服务器。这是为了记录代理请求的前几个客户端的 IP 地址,通常包括客户端的真实 IP 地址。

当目标服务器收到这些头部信息时,它可以通过 X-Real-IPX-Forwarded-For 头部来获取客户端的真实 IP 地址。

容易误以为的正向代理

比如我的网站项目 passjava.cn,项目是纯静态页面,部署在了一台服务器上。如下图所示,当我在浏览器访问这个域名时,请求会先经过 DNS 域名解析,拿到域名绑定的 IP 地址,而这个 IP 地址又是我购买的云服务器地址,在这个服务器上有网站的静态页面。

以下是 Nginx 的配置:

ini 复制代码
server {
    listen       80;
    server_name  www.passjava.cn;

    location / {
        root   /home/ubuntu/docs;
        index  index.html;
    }
}

我开始以为这是一个正向代理的配置,其实并不是,这个配置只是一个简单的虚拟主机配置,用于托管静态网站。这个配置定义了一个 Nginx 虚拟主机,用于处理来自 www.passjava.cn 域名的 HTTP 请求,并提供静态网页。

解释下这些配置项含义:

  1. server { ... }:这是一个 server 块,用于定义一个虚拟主机。每个 server 块通常用于配置一个不同的虚拟主机,以处理特定域名或 IP 地址的请求。
  2. listen 80;:这一行指定了监听的端口号,这里是 80,表示该虚拟主机将处理来自客户端的 HTTP 请求,这是 HTTP 的标准端口号。
  3. server_name www.passjava.cn;:这一行定义了虚拟主机所处理的域名。在这个例子中,虚拟主机将处理来自 www.passjava.cn 域名的请求。当客户端发送请求到这个域名时,Nginx 将使用这个 server 块中的配置来响应请求。
  4. location / { ... }:这是一个 location 块,它定义了如何处理特定 URI(统一资源标识符)路径的请求。在这里,location / 匹配所有请求的根路径。
  5. root /home/ubuntu/docs;:这一行指定了 Nginx 服务器上要提供的文件的根目录。当客户端请求根路径时,Nginx 将在 /home/ubuntu/docs 目录中查找文件来提供给客户端。
  6. index index.html;:这一行指定了默认的索引文件,当客户端请求的路径是一个目录时,Nginx 将尝试提供 index.html 文件作为默认文档。如果 /home/ubuntu/docs 目录中存在 index.html 文件,它将作为默认文档提供给客户端。

注意:正向代理配置通常涉及将客户端的请求代理到其他服务器,而不是提供自己的网页内容。正向代理的配置会包括一些额外的代理设置,用于将请求转发到目标服务器,而不是提供本地静态文件。

  • END -
相关推荐
星就前端叭43 分钟前
【开源】一款基于Vue3 + WebRTC + Node + SRS + FFmpeg搭建的直播间项目
前端·后端·开源·webrtc
小林coding2 小时前
阿里云 Java 后端一面,什么难度?
java·后端·mysql·spring·阿里云
AI理性派思考者2 小时前
【保姆教程】手把手教你在Linux系统搭建早期alpha项目cysic的验证者&证明者
后端·github·gpu
从善若水2 小时前
【2024】Merry Christmas!一起用Rust绘制一颗圣诞树吧
开发语言·后端·rust
机器之心2 小时前
终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果
人工智能·后端
机器之心2 小时前
首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招
人工智能·后端
运维&陈同学3 小时前
【模块一】kubernetes容器编排进阶实战之基于velero及minio实现etcd数据备份与恢复
数据库·后端·云原生·容器·kubernetes·etcd·minio·velero
waterme1onY3 小时前
Spring AOP 中记录日志
java·开发语言·笔记·后端
全栈开发帅帅4 小时前
基于springboot+vue实现的博物馆游客预约系统 (源码+L文+ppt)4-127
java·spring boot·后端
zyh_0305215 小时前
GIN中间件
后端·golang·gin