如何追查一个packet在linux 系统哪里丢失

要想追一个包在系统哪里丢失了, 就要了解 一个应用层的包在送出时 要经历那些 检查点 和被丢掉的点。

  1. 在传输层,如果是 tcp 包 会有contrack 的 buf 的限制 可能会导致 packets 的丢失。

=> 检查办法:查看dmesg日志有报错:kernel: nf_conntrack: nf_conntrack: table full, dropping packet , cat /proc/net/nf_conntrack.

nf_conntrack 的作用时记录tcp 的 连接状况表。

Linux系统nf_conntrack连接跟踪机制简介_nf conntrack-CSDN博客

  1. 在传输层 如果是tcp 每个系统都有tcp 的最大连接数 (tcp_max_syn_backlog 是 Linux 系统中用于控制 TCP 三次握手期间半连接(SYN_RCVD 状态)的最大队列长度的参数。在 TCP 三次握手过程中,服务器在收到客户端的 SYN 包后,会将对应的半连接放入一个队列中,等待完成三次握手的过程。当这个队列满了之后,新的连接请求将会被丢弃,这可能会导致客户端连接超时或者请求失败。为了避免这种情况,可以通过调整 tcp_max_syn_backlog 参数来增加该队列的长度,从而允许更多的半连接在队列中等待完成握手)

=> 检查方法: cat /proc/sys/net/ipv4/tcp_max_syn_backlog

  1. 在传输层 如果是tcp 每个系统的session 的time_wait 都不同,这样导致packets 的先手顺序乱了 导致丢包 ( 这个问只在当系统开启了tcp_tw_recycle时有) 该配置项可用于快速回收处于TIME_WAIT状态的socket以便重新分配。默认是关闭的,必要时可以开启该配置。但是开启该配置项后,有一些需要注意。

=>我们可以查看cat /proc/sys/net/ipv4/tcp_max_tw_buckets 最大条数, 然后如果cat /proc/sys/net/ipv4/tcp_rw_recycle 开启时, 我们可以用netsta -at | grep "TIME_WAIT" | wc -n 来统计有多少半连接, 然后 在抓包 如果会的RST 那基本就是这个导致的。

  1. 在IP层packets 要经过 iptable 的过滤。

=>iptables -nvL 查看所有 规则

iptables -A INPUT -j LOG --log-prefix="iptables-" 然后 dmesg 查看 iptables 的包的匹配情况。

5.在ip 层还有的系统开启了反向路由检查rp_filter, 当 source 不能再 本地从收报的口路由出去时就drop。

= > 反向路由也还是一种保护机制, 就是我必须能把source 地址从我的端口送出去。

cat /proc/sys/net/ipv4/conf/all/rp_filter

https://www.cnblogs.com/lipengxiang2009/p/7446388.html

  1. 再网卡层nic,由于现在都使用dma 技术 所以 nic 的ring buffer 满的时候 就会drop packets

=> cat /proc/net/dev 其中的fifo 就是指的时ring buffer full 的drop count

ethtool -g eth0

ethtool -G eth0 rx 4096 tx 4096 更改ring buffer

ifconfig 中的overruns 也是统计ring buffer 满了drop 的count

  1. 在进入每个协议栈前 会有一个缓存队列,比如ip->tcp , 每个cpu 都有一个 协议栈缓存队列,当队列满了时 就会drop packets。 也就是软中断 响应不够。

=>通过查看 /proc/net/softnet_stat 可以确定是否发生了 netdev backlog 队列溢出

每一行代表每个 CPU 核的状态统计,从 CPU0 依次往下;每一列代表一个 CPU 核的各项统计:第一列代表中断处理程序收到的包总数;第二列即代表由于 netdev_max_backlog 队列溢出而被丢弃的包总数。

查看这个队列大小 cat /proc/sys/net/core/netdev_max_backlog

  1. MTU 设置 不合理 导致的packets drop

=> ifconfig eth0 去查看 mtu 大小

由于 mtu 设置不和里导致 分片和重组 变得很多导致cpu 和一些buf 满了, 导致performance 低。

网络问题 多用ethtoool,ifconfig 工具, /proce/sys/net 下是一些 设定,proc/net 下多是一些统计信息

reference:https://zhuanlan.zhihu.com/p/692288382

相关推荐
t5y223 小时前
【Linux】定时任务调度
linux·服务器
HY小海4 小时前
【Linux】进程概念
linux·运维·服务器
王八八。4 小时前
linux后台java、postSQL部署命令
java·linux·运维
瑞熙贝通实验室综合管理平台5 小时前
实验动物管理系统|以痛点为核心 构建动物房数字化管理新体系
linux
黄筱筱筱筱筱筱筱7 小时前
LINUX-防火墙
linux·服务器·网络
сокол7 小时前
【网安-Web渗透测试-靶场系列】AWD-Platform(ctf-hub)
linux·服务器·ubuntu·网络安全·docker
utf8mb4安全女神8 小时前
Linux系统服务相关命令【定时任务设置】【任务进程管理】【防火墙区域应用】
linux·运维·服务器
CPETW10 小时前
RS-232 Sniffer 嗅探器 ---- UNI-T电子负载通讯协议抓取-C
网络
L、21810 小时前
昇腾NPU性能调优Checklist——从“能跑“到“跑得快“的20步
服务器·人工智能·深度学习
liulilittle11 小时前
TCP UCP 卡尔曼滤波器
网络·网络协议·tcp/ip·通信