如何追查一个packet在linux 系统哪里丢失

要想追一个包在系统哪里丢失了, 就要了解 一个应用层的包在送出时 要经历那些 检查点 和被丢掉的点。

  1. 在传输层,如果是 tcp 包 会有contrack 的 buf 的限制 可能会导致 packets 的丢失。

=> 检查办法:查看dmesg日志有报错:kernel: nf_conntrack: nf_conntrack: table full, dropping packet , cat /proc/net/nf_conntrack.

nf_conntrack 的作用时记录tcp 的 连接状况表。

Linux系统nf_conntrack连接跟踪机制简介_nf conntrack-CSDN博客

  1. 在传输层 如果是tcp 每个系统都有tcp 的最大连接数 (tcp_max_syn_backlog 是 Linux 系统中用于控制 TCP 三次握手期间半连接(SYN_RCVD 状态)的最大队列长度的参数。在 TCP 三次握手过程中,服务器在收到客户端的 SYN 包后,会将对应的半连接放入一个队列中,等待完成三次握手的过程。当这个队列满了之后,新的连接请求将会被丢弃,这可能会导致客户端连接超时或者请求失败。为了避免这种情况,可以通过调整 tcp_max_syn_backlog 参数来增加该队列的长度,从而允许更多的半连接在队列中等待完成握手)

=> 检查方法: cat /proc/sys/net/ipv4/tcp_max_syn_backlog

  1. 在传输层 如果是tcp 每个系统的session 的time_wait 都不同,这样导致packets 的先手顺序乱了 导致丢包 ( 这个问只在当系统开启了tcp_tw_recycle时有) 该配置项可用于快速回收处于TIME_WAIT状态的socket以便重新分配。默认是关闭的,必要时可以开启该配置。但是开启该配置项后,有一些需要注意。

=>我们可以查看cat /proc/sys/net/ipv4/tcp_max_tw_buckets 最大条数, 然后如果cat /proc/sys/net/ipv4/tcp_rw_recycle 开启时, 我们可以用netsta -at | grep "TIME_WAIT" | wc -n 来统计有多少半连接, 然后 在抓包 如果会的RST 那基本就是这个导致的。

  1. 在IP层packets 要经过 iptable 的过滤。

=>iptables -nvL 查看所有 规则

iptables -A INPUT -j LOG --log-prefix="iptables-" 然后 dmesg 查看 iptables 的包的匹配情况。

5.在ip 层还有的系统开启了反向路由检查rp_filter, 当 source 不能再 本地从收报的口路由出去时就drop。

= > 反向路由也还是一种保护机制, 就是我必须能把source 地址从我的端口送出去。

cat /proc/sys/net/ipv4/conf/all/rp_filter

https://www.cnblogs.com/lipengxiang2009/p/7446388.html

  1. 再网卡层nic,由于现在都使用dma 技术 所以 nic 的ring buffer 满的时候 就会drop packets

=> cat /proc/net/dev 其中的fifo 就是指的时ring buffer full 的drop count

ethtool -g eth0

ethtool -G eth0 rx 4096 tx 4096 更改ring buffer

ifconfig 中的overruns 也是统计ring buffer 满了drop 的count

  1. 在进入每个协议栈前 会有一个缓存队列,比如ip->tcp , 每个cpu 都有一个 协议栈缓存队列,当队列满了时 就会drop packets。 也就是软中断 响应不够。

=>通过查看 /proc/net/softnet_stat 可以确定是否发生了 netdev backlog 队列溢出

每一行代表每个 CPU 核的状态统计,从 CPU0 依次往下;每一列代表一个 CPU 核的各项统计:第一列代表中断处理程序收到的包总数;第二列即代表由于 netdev_max_backlog 队列溢出而被丢弃的包总数。

查看这个队列大小 cat /proc/sys/net/core/netdev_max_backlog

  1. MTU 设置 不合理 导致的packets drop

=> ifconfig eth0 去查看 mtu 大小

由于 mtu 设置不和里导致 分片和重组 变得很多导致cpu 和一些buf 满了, 导致performance 低。

网络问题 多用ethtoool,ifconfig 工具, /proce/sys/net 下是一些 设定,proc/net 下多是一些统计信息

reference:https://zhuanlan.zhihu.com/p/692288382

相关推荐
杜文龙29 分钟前
gitlab系统搭建AI代码自动审查多项目可复用架构
linux
星辰烈龙35 分钟前
黑马程序员JavaSE基础加强d5
服务器·网络·php
单片机系统设计40 分钟前
基于STM32的水质检测系统
网络·stm32·单片机·嵌入式硬件·毕业设计·水质检测
浩子智控1 小时前
分区操作系统、容器化、虚拟机的概念
服务器·系统安全
小宇的天下1 小时前
Calibre 3Dstack --每日一个命令day7【Centers】(3-7)
java·服务器·数据库
晃晃OoO悠悠1 小时前
Linux下禁用触摸板
linux
济6171 小时前
linux(第九期)--交叉编译器-- Ubuntu20.04
linux·运维·服务器
zxdzxdzzxd1 小时前
Tailscale Linux 登录指南
linux·运维·服务器
mangge081 小时前
ESP8266 温湿度监测系统教程(SHT30+MAX7219+LeanCloud+HTTP 服务)
网络·网络协议·http
DreamLife☼1 小时前
反射内存-【Linux实战】反射内存(RFM)驱动编译与应用开发全指南:从内核模块到用户态程序
linux·低延迟·反射内存·实时网·5565·rfm2gdma配置·中断延迟优化