web缓存-----squid代理服务

squid相关知识

1 squid的概念

Squid服务器缓存频繁要求网页、媒体文件和其它加速回答时间并减少带宽堵塞的内容。

Squid代理服务器(Squid proxy server)一般和原始文件一起安装在单独服务器而不是网络服务器上。Squid通过追踪网络中的对象运用起作用。Squid最初担当中介,仅仅是把客户要求传递到服务器并存储要求对象的拷贝。如果同一个客户或同一批客户在要求还在Squid缓存(cache)时要求相同的对象,Squid就可以立刻服务,加速下载并保存带宽。

2.squid作用

正向代理,缓存加速,基于acl可以过滤控制

3.squid代理的工作机制

1.squid是代替客户端向网站请求数据,不需要访问代理的IP地址。直接请求目的网站,有代理服务器请求和响应

可以隐藏用户的真实IP地址。2.访问目标网站之后(静态web元素)保存到缓存中,发送给客户端。下一次所有的客户机都可以使用这个缓存访问。加快访问速度。

工作流程图(仅是静态资源,动态资源无法走缓存):

4.squid代理的作用

  • 资源获取:代替客户端获取目标服务器的资源
  • 加速访问:代理服务器可能和目标服务器距离更近,可以起到一定的加速作用
  • 缓存作用:代理服务器保存从目标服务器获取的资源。客户端下一次请求目标服务器可以直接访问缓存即可。减轻目标服务器的压力
  • 隐藏真实的IP地址。代理服务器代替客户端请求。客户端的信息不会显示.

5.squid代理的类型

  • 传统代理,正向代理,需要在客户端上指定好代理服务器的地址和端口
  • 透明代理,客户端不再需要指定代理服务器的地址和端口,而是通过默认路由来进行转发。(squid服务器,网关)
  • 反向代理,在反向代理的squid服务器当中,缓存了这个请求资源,将资源直接返回给客户端。否则代理服务器会继续代替客户端向外部服务器发起请求。然后请求之后再把请求的资源响应给客户端。同时把响应缓存在本地,后续请求者都可以使用。

有缓存直接响应缓存内容,没有缓存才会代替客户端去请求web资源。响应结果先保存在缓存,再响应给客户端,下一次直接访问缓存就行了。

SNAT,DNAT和squid区别

|-----------------------------|----------------------------------------------------------------|
| SNAT和DNAT | squid |
| 网络层 | 应用层 |
| 数据包,会改变数据包头部的源IP地址和目的地址 | 不改变数据包的任何信息,直接把数据包发给代理。代理通过应用层过滤的方式来实现转发。(有点像路由器,本身就是末梢网络) |

正向代理

sql 复制代码
test1  客户端      20.0.0.20
test2  squid       20.0.0.140
web页面:nginx1    20.0.0.80 
        nginx2     20.0.0.90

实验:

sql 复制代码
systemctl stop firewalld
setenforce 0
cd /opt
拖入包
yum -y install gcc gcc-c++ make
tar zxvf squid-3.5.28.tar.gz -C /opt/
cd /opt/squid-3.5.28

./configure --prefix=/usr/local/squid \
--sysconfdir=/etc \
--enable-arp-acl \
--enable-linux-netfilter \
--enable-linux-tproxy \
--enable-async-io=100 \
--enable-err-language="Simplify_Chinese" \
--enable-underscore \
--disable-poll \
--enable-epoll \
--enable-gnuregex

make && make install

ln -s /usr/local/squid/sbin/* /usr/local/sbin/

useradd -M -s /sbin/nologin squid

chown -R squid:squid /usr/local/squid/var/		#此目录用于存放缓存文件

squid:

sql 复制代码
vim /etc/squid.conf
56   http_access allow all

60 http_port 3128
61 cache_effective_user squid
   cache_effective_group squid
68 ******/usr/local/squid/var/

squid -k parse  //查看配置文件是否正确
squid -N -d1    //查看是否允许

!! squid的配置文件重启不会有任何信息,不会报错,所以得自行检查是否有误

创建 Squid 服务脚本

netstat -antp | grep squid

sql 复制代码
vim /etc/init.d/squid
#!/bin/bash
#chkconfig: 2345 90 25
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"

case "$1" in
   start)
     netstat -natp | grep squid &> /dev/null
     if [ $? -eq 0 ]
     then
       echo "squid is running"
     else
       echo "正在启动 squid..."
       $CMD
     fi
   ;;
   stop)
     $CMD -k kill &> /dev/null
     rm -rf $PID &> /dev/null
   ;;
   status)
     [ -f $PID ] &> /dev/null
        if [ $? -eq 0 ]
          then
            netstat -natp | grep squid
          else
            echo "squid is not running"
        fi
   ;;
   restart)
      $0 stop &> /dev/null
      echo "正在关闭 squid..."
      $0 start &> /dev/null
      echo "正在启动 squid..."
   ;;
   reload)
      $CMD -k reconfigure
   ;;
   check)
      $CMD -k parse
   ;;
   *)
      echo "用法:$0{start|stop|status|reload|check|restart}"
   ;;
esac

#2345是默认自启动级别,如是-代表任何级别都不自启动;90是启动优先级,
25是停止优先级,优先级范围是0-100,数字越大,优先级越低。
chmod +x /etc/init.d/squid
chkconfig --add squid
chkconfig --level 35 squid on

客户端:

使用squid缓存

缓存成功标志:

构建传统代理(正向代理)

搭建一个squid服务能够代替客户机进行对web服务器的资源缓存(该模式需要客户机手动添加代理服务器)

sql 复制代码
vim /etc/squid.conf
......
http_access allow all
http_access deny all
http_port 3128
cache_effective_user squid
cache_effective_group squid
--63行--插入
cache_mem 2000 G				#指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
reply_body_max_size 100 MB			#允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现"请求或访问太大"的提示默认设置0表示不进行限制
maximum_object_size 100 MB			#允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户

service squid restart
systemctl restart squid
sql 复制代码
生产环境中还需要修改防火墙规则
iptables -F
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT

#客户机的代理配置
打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址:Squid服务器IP地址,端口:3128)

#查看 Squid 访问日志的新增记录中的缓存命中情况
tail -f /usr/local/squid/var/logs/access.log
TCP_MEM_HIT/200

TCP_REFRESH_UNMODIFIED/304: TCP_REFRESH_UNMODIFIED 表示该请求是由于缓存未过期,
直接返回未修改的响应。304 表示 HTTP 状态码为 304(未修改)。

#查看 Web 访问日志的新增记录
tail -f /var/log/httpd/access_log
在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。

squid -m PURGE http://192.168.233.30
#清除缓存,指定对象服务器的url.

构建透明代理服务器

test2设置为双网卡

客户机 12.0.0.12

双网卡分别指向网关

同一转发

指定服务器:

http_port 192.168.233.20 :3108 transparent

systemctl restart squid

然后去test1 的网卡配置文件

注释DNSD,修改网关

sql 复制代码
vim /etc/squid.conf
......
http_access allow all
http_access deny all
--60行--修改添加提供内网服务的IP地址,和支持透明代理选项 transparent
#http_port 3128
http_port 192.168.233.20:3128 transparent
#之前的端口配置注释掉,重启之后会有端口冲突,记得杀掉之前的进程。

squid -k parse

squid -N -d1

systemctl restart squid

#开启路由转发,实现本机中不同网段的地址转发
echo 'net.ipv4.ip_forward = 1' >> /etc/sysctl.conf
sysctl -p

#修改防火墙规则
iptables -F
iptables -t nat -F
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 80 -j REDIRECT --to 3128	
#用于转发http协议

iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 443 -j REDIRECT --to 3128	
#用于转发https协议

iptables -I INPUT -p tcp --dport 3128 -j ACCEPT

Web服务器配置

sql 复制代码
yum install -y httpd
systemctl start httpd


关闭客户机的浏览器之前设置的代理服务器的功能后访问 http://12.0.0.12

#查看 Squid 访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
1631073624.552      0 192.168.233.20 TCP_MEM_HIT/200 449 GET http://12.0.0.12/ - HIER_NONE/- text/html

#查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问
tail -f /var/log/httpd/access_log

test2

sql 复制代码
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 80 -j REDIRECT --to 3128

iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 443 -j REDIRECT --to 3128

iptables -T INPUT --dport 3128 -j accecp

ACL访问控制

sql 复制代码
vim /etc/squid.conf
......
acl localhost src 192.168.233.10/32 				#源地址为 192.168.233.10
acl MYLAN src 192.168.233.0/24 192.168.1.0/24		#客户机网段
acl destinationhost dst 192.168.233.30/32			#目标地址为 192.168.233.30
acl MC20 maxconn 20									#最大并发连接 20
acl PORT port 21									#目标端口 21
acl DMBLOCK dstdomain .qq.com						#目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule://			#以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写
acl PURL urlpath_regex -i \.mp3$ \.mp4$ \.rmvb$		#以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
acl WORKTIME time MTWHF 08:30-17:30					#时间为周一至周五 8:30~17:30,"MTWHF"为每个星期的英文首字母

在后面配置:
acl Safe_ports port 591         # filemaker
acl Safe_ports port 777         # multiling http
acl myhost1 src 192.168.233.10/32
acl myhost2 dst "/etc/squid/dest.list"
acl lock dstdomain .baidu.com
http_access deny myhost2


#启动对象列表管理
mkdir /etc/squid
vim /etc/squid/dest.list
192.168.233.30
192.168.233.0/24

vim /etc/squid.conf
......
acl destinationhost dst "/etc/squid/dest.list"			#调用指定文件中的列表内容
......
http_access deny(或allow) destinationhost				#注意,如果是拒绝列表,需要放在http_access allow all前面


systemctl restart squid

浏览器访问Web服务器 http://192.168.80.13 ,显示被访问被拒绝。

让策略生效:

sql 复制代码
http_access deny myhost1

wq

systemctl restart squid



test1访问,会显示  deny失败



mkdir /etc/suqid

cd /etc/squid/

vim dest.list

12.0.0.12

wq

vim /etc/squid.conf

acl myhost2 dst "/etc/squid/dest.list"

http_access deny myhost2

-Squid 反向代理

如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

工作机制:

●缓存网页对象,减少重复请求

●将互联网请求轮训或按权重分配到内网Web服务器

●代理用户请求,避免用户直接访问Web服务器,提高安全

sql 复制代码
vim /etc/squid.conf
......
--60行--修改,插入
http_port 192.168.233.20:80 accel vhost vport
cache_peer 192.168.233.61 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.233.62 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.kgc.com
#表示对www.kgc.com的请求,squid向192.168.233.61和192.168.233.62的80端口发出请求

//清空之前透明模式配置的 iptables 规则

sql 复制代码
iptables -F
iptables -t nat -F

systemctl stop httpd       #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
systemctl restart squid


#后端节点服务器设置
yum install -y httpd
systemctl start httpd

#节点1:
echo "this is test01" >> /var/www/html/index.html
#节点2:
echo "this is test02" >> /var/www/html/index.html


#客户机的域名映射配置
修改 C:\Windows\System32\drivers\etc\hosts 文件
192.168.233.20 www.kgc.com

echo "192.168.233.20 www.kgc.com" >>/etc/hosts

浏览器不开启代理访问 http://www.kgc.com

查看缓存命中情况 
tail -f /usr/local/squid/var/logs/access.log
1631164427.547      0 192.168.80.200 TCP_MEM_HIT/200 381 GET http://www.kgc.com/ - HIER_NONE/- text/html

vim /etc/squid.conf

http_port 192.168.233.20:80 accel vhost vport

squid从一个缓存变成了一个web服务器的反向代理的加速模式 squid监听的是80端口的请求。同时和web服务器的请求端口绑定到一块儿。

squid不是转发请求,而是从缓存获取数据,要么直接请求绑定的web端口

accel:反向代理开启加速模式

vhost:支持域名或者主机名来代表代理节点

vport:可以支持IP+端口来表示代理服务器

cache_peer 192.168.233.61 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1

cache_peer 192.168.233.62 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2

cache_peer_domain web1 web2 <www.kgc.com>

缓存获取失败,请求服务器名

parent 80 0:上下级的关系 80

0:就是一台代理服务器,不涉及运营商

no-query:不查询,直接获取数据

originserver:指定源服务器

round-robin max_conn=30 weight=1 name=web1:squid通过轮询的方式,将请求分发到其中一台父节点

max_conn=30 :最大连接数

weight=1:权重

name=web1:设置别名

相关推荐
材料苦逼不会梦到计算机白富美2 小时前
golang分布式缓存项目 Day 1
分布式·缓存·golang
Java 第一深情2 小时前
高性能分布式缓存Redis-数据管理与性能提升之道
redis·分布式·缓存
HBryce243 小时前
缓存-基础概念
java·缓存
想要打 Acm 的小周同学呀10 小时前
LRU缓存算法
java·算法·缓存
hlsd#10 小时前
go 集成go-redis 缓存操作
redis·缓存·golang
镰刀出海10 小时前
Recyclerview缓存原理
java·开发语言·缓存·recyclerview·android面试
奶糖趣多多12 小时前
Redis知识点
数据库·redis·缓存
CoderIsArt13 小时前
Redis的三种模式:主从模式,哨兵与集群模式
数据库·redis·缓存
ketil2717 小时前
Redis - String 字符串
数据库·redis·缓存
生命几十年3万天19 小时前
redis时间优化
数据库·redis·缓存