使用命令行工具控制wireshark对抓包文件进行针对性处理的总结

近日,工作中有开发对抓包文件进行针对性过滤的小程序的需求,兜兜转转踩了很多坑后还是绕回了wireshark。

作为最出名的开源软件之一,wireshark也具有使用命令行进行操作的功能,这就是我们今天会总结到的"tshark.exe"。

通常,当你安装好wireshark,这个"tshark"就会和你的wireshark在同一路径下默默的躺着,就长这样:

这个程序和图形化的wireshark功能基本相同,接下来我会针对性地对使用该软件对已经完成抓包生成的抓包文件(.pacpng、.pacp)进行解析的功能命令进行总结。

先上一个例子:

bash 复制代码
D:\**你的路径**\tshark.exe -r "C:\**你的路径**\抓包数据.pcap" -Y esp -T fields -e esp.spi -e esp.sequence  -e ip.src -e ip.dst

运行输出结果如下:

这个代码以tshark的绝对路径开头(配置环境变量会更方便),然后是抓包文件的路径指定文件,然后是各种过滤指令和字段选择,达到了针对某文件输出我们需要的字段的效果。

下面开始系统性介绍。

1、读取抓包文件

使用 -r 读取已有的抓包文件:

bash 复制代码
tshark -r <infile>

<infile> 是输入的抓包文件名。

2. 过滤数据

2.1 显示过滤器

使用 -Y 选项指定显示过滤器,过滤解码数据或写入文件的包:

bash 复制代码
tshark -r <infile> -Y <display filter>

<display filter> 是显示过滤器表达式,使用读/显示过滤器的语法,而不是捕获过滤器的语法。

2.2 读取过滤器

使用 -R 选项指定读取过滤器,在分析的第一遍中应用,不匹配的包将不考虑后续遍历:

bash 复制代码
tshark -r <infile> -R <read filter>

<read filter> 是读取过滤器表达式,同样使用读/显示过滤器的语法。

3. 输出格式

3.1 输出格式类型

使用 -T 选项设置输出格式:

bash 复制代码
tshark -r <infile> -T <format>

<format> 可以是以下之一:

  • ek:用于批量导入 Elasticsearch 的换行符分隔 JSON 格式。

  • fields:指定字段的值,格式由 -E 选项控制。

  • json:JSON 文件格式。

  • jsonraw:仅包含原始十六进制编码包数据的 JSON 文件格式。

  • pdml:XML 格式的包详情。

  • ps:PostScript 格式。

  • psml:XML 格式的包摘要。

  • tabs:类似于默认文本报告,但使用制表符分隔。

  • text:默认的人可读文本格式。

3.2 指定输出字段

使用 -e 选项添加要显示的字段,智能与 -T ek|fields|json|pdml 之一配合使用:

bash 复制代码
tshark -r <infile> -T fields -e <field1> -e <field2> ...

<field1>, <field2> 等是要显示的字段。

3.3 设置字段打印选项

使用 -E 选项控制字段打印格式:

bash 复制代码
tshark -r <infile> -T fields -E <option>

<option> 可以是以下之一:

  • bom=y|n:是否添加 UTF-8 字节顺序标记,默认为 n

  • header=y|n:是否打印字段名作为输出的第一行,默认为 n

  • separator=/t|/s|<character>:设置字段分隔符,默认为制表符。

  • occurrence=f|l|a:选择字段的出现次数,默认为 a

  • aggregator=,|/s|<character>:设置字段聚合符,默认为逗号。

  • quote=d|s|n:设置字段的引用字符,默认为无。

  • escape=y|n:是否对字段值中的空白控制字符进行转义,默认为 y

到这里我们就可以系统性地输出数据包中我们想要的值了!

这时候有小伙伴们要问了"博主博主,命令行我们明白了,但该怎么用到程序里呢?"

欸,我演示一个函数你就明白了,调用起来不要太轻松:

python 复制代码
    def process_certificates(self, file_path, display_filter):
        command = [
            self.tshark_path,
            '-r', file_path,
            '-Y', f'tls.handshake.type==11&&{display_filter}',
            '-T', 'fields',
            '-e', 'ip.src',
            '-e', 'ip.dst',
            '-e', 'tls.handshake.certificate'
        ]
        lines = self.run_tshark_command(command)

        for line in lines:
            parts = line.split('\t')
            if len(parts) < 3:
                continue
            src_ip, dst_ip, certs_hex = parts
            try:
                certs = certs_hex.split(',')
                for cert_hex in certs:
                    cert_der = bytes.fromhex(cert_hex)
                    self.process_single_cert(cert_der, src_ip, dst_ip)
            except ValueError:
                continue
                
    def run_tshark_command(self, command):
        try:
            result = subprocess.run(
                command,
                stdout=subprocess.PIPE,
                stderr=subprocess.PIPE,
                check=True,
                text=True
            )
            return result.stdout.splitlines()

通过调用上面的函数,我们就完成了对命令的拼接,对输出的读取。

经过进一步简单处理,我们就达到了筛选所有TLS握手过程中传递的证书的效果,还顺带得到了他们的源IP目的IP等信息。

最后经过同理的简单开发,可得到这样的效果

------END------

相关推荐
Sweet_vinegar2 分钟前
简单加密(BUGKU)
安全·ctf·base64·bugku·crypto
进击的六角龙21 分钟前
【Python数据分析+可视化项目案例】:亚马逊平台用户订单数据分析
开发语言·爬虫·python·数据分析·网络爬虫·数据可视化
蹦蹦跳跳真可爱58923 分钟前
Python---数据分析(Pandas九:二维数组DataFrame数据操作二: 数据排序,数据筛选,数据拼接)
python·信息可视化·数据分析·pandas
G皮T33 分钟前
【Python Cookbook】字符串和文本(一)
python·正则表达式·字符串·查找
云空1 小时前
《Gradio Python 客户端入门》
服务器·python
前端阿森纳1 小时前
使用 Conda + Pip 创建 Python 开发环境的完整教程
人工智能·python·机器学习
mosquito_lover11 小时前
Python实现人脸识别的六种技术及库调用示例
python·opencv
xiaozhazha_2 小时前
美图AI增强优化版 | 功能解锁与安全部署指南
人工智能·安全
Blossom.1182 小时前
从入门到进阶:Python数据可视化实战技巧
java·开发语言·spring boot·后端·python·网络协议·信息可视化
冷琴19962 小时前
基于python+django的旅游信息网站-旅游景点门票管理系统源码+运行步骤
python·django·旅游