如何追查一个packet在linux 系统哪里丢失

要想追一个包在系统哪里丢失了, 就要了解 一个应用层的包在送出时 要经历那些 检查点 和被丢掉的点。

  1. 在传输层,如果是 tcp 包 会有contrack 的 buf 的限制 可能会导致 packets 的丢失。

=> 检查办法:查看dmesg日志有报错:kernel: nf_conntrack: nf_conntrack: table full, dropping packet , cat /proc/net/nf_conntrack.

nf_conntrack 的作用时记录tcp 的 连接状况表。

Linux系统nf_conntrack连接跟踪机制简介_nf conntrack-CSDN博客

  1. 在传输层 如果是tcp 每个系统都有tcp 的最大连接数 (tcp_max_syn_backlog 是 Linux 系统中用于控制 TCP 三次握手期间半连接(SYN_RCVD 状态)的最大队列长度的参数。在 TCP 三次握手过程中,服务器在收到客户端的 SYN 包后,会将对应的半连接放入一个队列中,等待完成三次握手的过程。当这个队列满了之后,新的连接请求将会被丢弃,这可能会导致客户端连接超时或者请求失败。为了避免这种情况,可以通过调整 tcp_max_syn_backlog 参数来增加该队列的长度,从而允许更多的半连接在队列中等待完成握手)

=> 检查方法: cat /proc/sys/net/ipv4/tcp_max_syn_backlog

  1. 在传输层 如果是tcp 每个系统的session 的time_wait 都不同,这样导致packets 的先手顺序乱了 导致丢包 ( 这个问只在当系统开启了tcp_tw_recycle时有) 该配置项可用于快速回收处于TIME_WAIT状态的socket以便重新分配。默认是关闭的,必要时可以开启该配置。但是开启该配置项后,有一些需要注意。

=>我们可以查看cat /proc/sys/net/ipv4/tcp_max_tw_buckets 最大条数, 然后如果cat /proc/sys/net/ipv4/tcp_rw_recycle 开启时, 我们可以用netsta -at | grep "TIME_WAIT" | wc -n 来统计有多少半连接, 然后 在抓包 如果会的RST 那基本就是这个导致的。

  1. 在IP层packets 要经过 iptable 的过滤。

=>iptables -nvL 查看所有 规则

iptables -A INPUT -j LOG --log-prefix="iptables-" 然后 dmesg 查看 iptables 的包的匹配情况。

5.在ip 层还有的系统开启了反向路由检查rp_filter, 当 source 不能再 本地从收报的口路由出去时就drop。

= > 反向路由也还是一种保护机制, 就是我必须能把source 地址从我的端口送出去。

cat /proc/sys/net/ipv4/conf/all/rp_filter

https://www.cnblogs.com/lipengxiang2009/p/7446388.html

  1. 再网卡层nic,由于现在都使用dma 技术 所以 nic 的ring buffer 满的时候 就会drop packets

=> cat /proc/net/dev 其中的fifo 就是指的时ring buffer full 的drop count

ethtool -g eth0

ethtool -G eth0 rx 4096 tx 4096 更改ring buffer

ifconfig 中的overruns 也是统计ring buffer 满了drop 的count

  1. 在进入每个协议栈前 会有一个缓存队列,比如ip->tcp , 每个cpu 都有一个 协议栈缓存队列,当队列满了时 就会drop packets。 也就是软中断 响应不够。

=>通过查看 /proc/net/softnet_stat 可以确定是否发生了 netdev backlog 队列溢出

每一行代表每个 CPU 核的状态统计,从 CPU0 依次往下;每一列代表一个 CPU 核的各项统计:第一列代表中断处理程序收到的包总数;第二列即代表由于 netdev_max_backlog 队列溢出而被丢弃的包总数。

查看这个队列大小 cat /proc/sys/net/core/netdev_max_backlog

  1. MTU 设置 不合理 导致的packets drop

=> ifconfig eth0 去查看 mtu 大小

由于 mtu 设置不和里导致 分片和重组 变得很多导致cpu 和一些buf 满了, 导致performance 低。

网络问题 多用ethtoool,ifconfig 工具, /proce/sys/net 下是一些 设定,proc/net 下多是一些统计信息

reference:https://zhuanlan.zhihu.com/p/692288382

相关推荐
志栋智能34 分钟前
超自动化安全:构建智能安全运营的核心引擎
大数据·运维·服务器·数据库·安全·自动化·产品运营
AnalogElectronic2 小时前
linux 测试网络和端口是否连通的命令详解
linux·网络·php
Edward111111112 小时前
4月28日防火墙问题
linux·运维·服务器
想学后端的前端工程师3 小时前
【补充内外网突然不通的情况】
运维·服务器
Rust研习社3 小时前
使用 Axum 构建高性能异步 Web 服务
开发语言·前端·网络·后端·http·rust
灰子学技术3 小时前
Envoy HTTP 流量层面的 Metric 指标分析
网络·网络协议·http
上海云盾-小余3 小时前
海外恶意 UDP 攻击溯源:分层封禁策略与业务兼容平衡方案
网络·网络协议·udp
子琦啊3 小时前
【算法复习】字符串 | 两个底层直觉,吃透高频题
linux·运维·算法
智慧光迅AINOPOL3 小时前
校园全光网建设指南:从架构到调优,打造稳定高体验校园网络
网络·全光网解决方案·全光网·酒店全光解决方案·泛住宿全光网解决方案
被摘下的星星3 小时前
Internet 的域名系统:从“名字”到“地址”的翻译官
网络