squid相关知识
1 squid的概念
Squid服务器缓存频繁要求网页、媒体文件和其它加速回答时间并减少带宽堵塞的内容。
Squid代理服务器(Squid proxy server)一般和原始文件一起安装在单独服务器而不是网络服务器上。Squid通过追踪网络中的对象运用起作用。Squid最初担当中介,仅仅是把客户要求传递到服务器并存储要求对象的拷贝。如果同一个客户或同一批客户在要求还在Squid缓存(cache)时要求相同的对象,Squid就可以立刻服务,加速下载并保存带宽。
2.squid作用
正向代理,缓存加速,基于acl可以过滤控制
3.squid代理的工作机制
1.squid是代替客户端向网站请求数据,不需要访问代理的IP地址。直接请求目的网站,有代理服务器请求和响应
可以隐藏用户的真实IP地址。2.访问目标网站之后(静态web元素)保存到缓存中,发送给客户端。下一次所有的客户机都可以使用这个缓存访问。加快访问速度。
工作流程图(仅是静态资源,动态资源无法走缓存):
4.squid代理的作用
- 资源获取:代替客户端获取目标服务器的资源
- 加速访问:代理服务器可能和目标服务器距离更近,可以起到一定的加速作用
- 缓存作用:代理服务器保存从目标服务器获取的资源。客户端下一次请求目标服务器可以直接访问缓存即可。减轻目标服务器的压力
- 隐藏真实的IP地址。代理服务器代替客户端请求。客户端的信息不会显示.
5.squid代理的类型
- 传统代理,正向代理,需要在客户端上指定好代理服务器的地址和端口
- 透明代理,客户端不再需要指定代理服务器的地址和端口,而是通过默认路由来进行转发。(squid服务器,网关)
- 反向代理,在反向代理的squid服务器当中,缓存了这个请求资源,将资源直接返回给客户端。否则代理服务器会继续代替客户端向外部服务器发起请求。然后请求之后再把请求的资源响应给客户端。同时把响应缓存在本地,后续请求者都可以使用。
有缓存直接响应缓存内容,没有缓存才会代替客户端去请求web资源。响应结果先保存在缓存,再响应给客户端,下一次直接访问缓存就行了。
SNAT,DNAT和squid区别
|-----------------------------|----------------------------------------------------------------|
| SNAT和DNAT | squid |
| 网络层 | 应用层 |
| 数据包,会改变数据包头部的源IP地址和目的地址 | 不改变数据包的任何信息,直接把数据包发给代理。代理通过应用层过滤的方式来实现转发。(有点像路由器,本身就是末梢网络) |
正向代理
sql
test1 客户端 20.0.0.20
test2 squid 20.0.0.140
web页面:nginx1 20.0.0.80
nginx2 20.0.0.90
实验:
sql
systemctl stop firewalld
setenforce 0
cd /opt
拖入包
yum -y install gcc gcc-c++ make
tar zxvf squid-3.5.28.tar.gz -C /opt/
cd /opt/squid-3.5.28
./configure --prefix=/usr/local/squid \
--sysconfdir=/etc \
--enable-arp-acl \
--enable-linux-netfilter \
--enable-linux-tproxy \
--enable-async-io=100 \
--enable-err-language="Simplify_Chinese" \
--enable-underscore \
--disable-poll \
--enable-epoll \
--enable-gnuregex
make && make install
ln -s /usr/local/squid/sbin/* /usr/local/sbin/
useradd -M -s /sbin/nologin squid
chown -R squid:squid /usr/local/squid/var/ #此目录用于存放缓存文件
squid:
sql
vim /etc/squid.conf
56 http_access allow all
60 http_port 3128
61 cache_effective_user squid
cache_effective_group squid
68 ******/usr/local/squid/var/
squid -k parse //查看配置文件是否正确
squid -N -d1 //查看是否允许
!! squid的配置文件重启不会有任何信息,不会报错,所以得自行检查是否有误
创建 Squid 服务脚本
netstat -antp | grep squid
sql
vim /etc/init.d/squid
#!/bin/bash
#chkconfig: 2345 90 25
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"
case "$1" in
start)
netstat -natp | grep squid &> /dev/null
if [ $? -eq 0 ]
then
echo "squid is running"
else
echo "正在启动 squid..."
$CMD
fi
;;
stop)
$CMD -k kill &> /dev/null
rm -rf $PID &> /dev/null
;;
status)
[ -f $PID ] &> /dev/null
if [ $? -eq 0 ]
then
netstat -natp | grep squid
else
echo "squid is not running"
fi
;;
restart)
$0 stop &> /dev/null
echo "正在关闭 squid..."
$0 start &> /dev/null
echo "正在启动 squid..."
;;
reload)
$CMD -k reconfigure
;;
check)
$CMD -k parse
;;
*)
echo "用法:$0{start|stop|status|reload|check|restart}"
;;
esac
#2345是默认自启动级别,如是-代表任何级别都不自启动;90是启动优先级,
25是停止优先级,优先级范围是0-100,数字越大,优先级越低。
chmod +x /etc/init.d/squid
chkconfig --add squid
chkconfig --level 35 squid on
客户端:
使用squid缓存
缓存成功标志:
构建传统代理(正向代理)
搭建一个squid服务能够代替客户机进行对web服务器的资源缓存(该模式需要客户机手动添加代理服务器)
sql
vim /etc/squid.conf
......
http_access allow all
http_access deny all
http_port 3128
cache_effective_user squid
cache_effective_group squid
--63行--插入
cache_mem 2000 G #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
reply_body_max_size 100 MB #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现"请求或访问太大"的提示默认设置0表示不进行限制
maximum_object_size 100 MB #允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户
service squid restart
systemctl restart squid
sql
生产环境中还需要修改防火墙规则
iptables -F
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
#客户机的代理配置
打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址:Squid服务器IP地址,端口:3128)
#查看 Squid 访问日志的新增记录中的缓存命中情况
tail -f /usr/local/squid/var/logs/access.log
TCP_MEM_HIT/200
TCP_REFRESH_UNMODIFIED/304: TCP_REFRESH_UNMODIFIED 表示该请求是由于缓存未过期,
直接返回未修改的响应。304 表示 HTTP 状态码为 304(未修改)。
#查看 Web 访问日志的新增记录
tail -f /var/log/httpd/access_log
在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。
squid -m PURGE http://192.168.233.30
#清除缓存,指定对象服务器的url.
构建透明代理服务器
test2设置为双网卡
客户机 12.0.0.12
双网卡分别指向网关
同一转发
指定服务器:
http_port 192.168.233.20 :3108 transparent
systemctl restart squid
然后去test1 的网卡配置文件
注释DNSD,修改网关
sql
vim /etc/squid.conf
......
http_access allow all
http_access deny all
--60行--修改添加提供内网服务的IP地址,和支持透明代理选项 transparent
#http_port 3128
http_port 192.168.233.20:3128 transparent
#之前的端口配置注释掉,重启之后会有端口冲突,记得杀掉之前的进程。
squid -k parse
squid -N -d1
systemctl restart squid
#开启路由转发,实现本机中不同网段的地址转发
echo 'net.ipv4.ip_forward = 1' >> /etc/sysctl.conf
sysctl -p
#修改防火墙规则
iptables -F
iptables -t nat -F
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 80 -j REDIRECT --to 3128
#用于转发http协议
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 443 -j REDIRECT --to 3128
#用于转发https协议
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
Web服务器配置
sql
yum install -y httpd
systemctl start httpd
关闭客户机的浏览器之前设置的代理服务器的功能后访问 http://12.0.0.12
#查看 Squid 访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
1631073624.552 0 192.168.233.20 TCP_MEM_HIT/200 449 GET http://12.0.0.12/ - HIER_NONE/- text/html
#查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问
tail -f /var/log/httpd/access_log
test2
sql
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 80 -j REDIRECT --to 3128
iptables -t nat -I PREROUTING -i ens33 -s 192.168.233.0/24 -p tcp --dport 443 -j REDIRECT --to 3128
iptables -T INPUT --dport 3128 -j accecp
ACL访问控制
sql
vim /etc/squid.conf
......
acl localhost src 192.168.233.10/32 #源地址为 192.168.233.10
acl MYLAN src 192.168.233.0/24 192.168.1.0/24 #客户机网段
acl destinationhost dst 192.168.233.30/32 #目标地址为 192.168.233.30
acl MC20 maxconn 20 #最大并发连接 20
acl PORT port 21 #目标端口 21
acl DMBLOCK dstdomain .qq.com #目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule:// #以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写
acl PURL urlpath_regex -i \.mp3$ \.mp4$ \.rmvb$ #以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
acl WORKTIME time MTWHF 08:30-17:30 #时间为周一至周五 8:30~17:30,"MTWHF"为每个星期的英文首字母
在后面配置:
acl Safe_ports port 591 # filemaker
acl Safe_ports port 777 # multiling http
acl myhost1 src 192.168.233.10/32
acl myhost2 dst "/etc/squid/dest.list"
acl lock dstdomain .baidu.com
http_access deny myhost2
#启动对象列表管理
mkdir /etc/squid
vim /etc/squid/dest.list
192.168.233.30
192.168.233.0/24
vim /etc/squid.conf
......
acl destinationhost dst "/etc/squid/dest.list" #调用指定文件中的列表内容
......
http_access deny(或allow) destinationhost #注意,如果是拒绝列表,需要放在http_access allow all前面
systemctl restart squid
浏览器访问Web服务器 http://192.168.80.13 ,显示被访问被拒绝。
让策略生效:
sql
http_access deny myhost1
wq
systemctl restart squid
test1访问,会显示 deny失败
mkdir /etc/suqid
cd /etc/squid/
vim dest.list
12.0.0.12
wq
vim /etc/squid.conf
acl myhost2 dst "/etc/squid/dest.list"
http_access deny myhost2
-Squid 反向代理
如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。
工作机制:
●缓存网页对象,减少重复请求
●将互联网请求轮训或按权重分配到内网Web服务器
●代理用户请求,避免用户直接访问Web服务器,提高安全
sql
vim /etc/squid.conf
......
--60行--修改,插入
http_port 192.168.233.20:80 accel vhost vport
cache_peer 192.168.233.61 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.233.62 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.kgc.com
#表示对www.kgc.com的请求,squid向192.168.233.61和192.168.233.62的80端口发出请求
//清空之前透明模式配置的 iptables 规则
sql
iptables -F
iptables -t nat -F
systemctl stop httpd #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
systemctl restart squid
#后端节点服务器设置
yum install -y httpd
systemctl start httpd
#节点1:
echo "this is test01" >> /var/www/html/index.html
#节点2:
echo "this is test02" >> /var/www/html/index.html
#客户机的域名映射配置
修改 C:\Windows\System32\drivers\etc\hosts 文件
192.168.233.20 www.kgc.com
echo "192.168.233.20 www.kgc.com" >>/etc/hosts
浏览器不开启代理访问 http://www.kgc.com
查看缓存命中情况
tail -f /usr/local/squid/var/logs/access.log
1631164427.547 0 192.168.80.200 TCP_MEM_HIT/200 381 GET http://www.kgc.com/ - HIER_NONE/- text/html
vim /etc/squid.conf
http_port 192.168.233.20:80 accel vhost vport
squid从一个缓存变成了一个web服务器的反向代理的加速模式 squid监听的是80端口的请求。同时和web服务器的请求端口绑定到一块儿。
squid不是转发请求,而是从缓存获取数据,要么直接请求绑定的web端口
accel:反向代理开启加速模式
vhost:支持域名或者主机名来代表代理节点
vport:可以支持IP+端口来表示代理服务器
cache_peer 192.168.233.61 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.233.62 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 <www.kgc.com>
缓存获取失败,请求服务器名
parent 80 0:上下级的关系 80
0:就是一台代理服务器,不涉及运营商
no-query:不查询,直接获取数据
originserver:指定源服务器
round-robin max_conn=30 weight=1 name=web1:squid通过轮询的方式,将请求分发到其中一台父节点
max_conn=30 :最大连接数
weight=1:权重
name=web1:设置别名