【数据集】Maple-IDS——网络安全恶意流量检测数据集

一、数据集介绍

Maple-IDS数据集是一个网络入侵检测评估数据集,旨在增强异常基础入侵检测系统(IDS)和入侵预防系统(IPS)的性能和可靠性。随着网络空间安全领域攻击的日益复杂化,拥有一个可靠和最新的数据集对于测试和验证IDS和IPS解决方案至关重要。

数据集由东北林业大学网络安全实验室发布,欢迎引用和使用,完全免费!

实验室官网:东北林业大学网络安全实验室

二、数据集发布背景

传统的评估数据集的攻击流量和利用方式,往往内容过时、流量多样性不足、攻击种类不足、特征不足,最重要的是 HTTPS/TLS 加密已经普及了。枫叶数据集提供了一个全面、现代的数据集来应对这些挑战,用于入侵检测研究。

三、Maple-IDS兼容使用CIC-IDS数据集的代码

如果你的代码是用CIC-IDS数据集训练或者编写的,那么可以直接更换到Maple-IDS数据集上。 Maple-IDS数据集与您之前的工作兼容。可以直接使用 CICFlowMeter 生成 CSV 文件! 无需重写代码或进行其他工作。

四、Maple-IDS数据集类别概览(包含内容)

内容:数据集包含最新的常见攻击,类似于真实世界的网络流量(PCAP/PCAPNG 格式)。

流量分析:使用 CICFlowMeter 进行的网络流量分析结果,标记基于时间戳、源和目标IP地址、端口、协议和攻击类型的流,存储在CSV文件中。

DDoS 攻击:数据集包括 DDoS 攻击,这些在真实世界的网络流量中很常见。并且由于随机内容,数据集更加多样化。GET、POST、HEAD 和 OPTIONS 是最常见的 HTTP 方法。

对每种服务细分的流量包和数据集 :我们对于每种服务(HTTP、HTTPS、SMTP、IMAP、POP3、FTP、SSH、RESTful API、gRPC、WASM)都提供了数据集。

多样的流量 :对于 ping 或者 HTTP,DDoS 的形式就多种多样,TCP,UDP, SYN 攻击,还有 ICMP 走私,我们的数据集都有覆盖到。

N-day 漏洞:数据集包括 n-day 漏洞,如 OpenSSL 中存在的著名漏洞 HeartBleed,日后打算囊括更多的 CVE 漏洞。

五、更多功能即将推出

DPDK、PF_RING 支持

如果您有任何问题或建议,请给我们反馈。

六、Maple-IDS数据集生成

我们通过模拟真实世界的网络流量中观察到的模式和模式来对流量进行配置。基于HTTP、HTTPS与SM3/4、GOST等,我们构建了用户的抽象行为。SSH、RESTful API、gRPC、WASM,这些现代+协议及其各种实现等,都为这个数据集构建了内容。

七、我们提供的处理工具

在创建数据集的过程中,我们使用了许多自己开发的工具。它们是开源的,可以免费下载。一般来说,工具的仓库中都有教程。见:https://github.com/maple-nefu/pcap2para

更多工具即将推出,请给我们一点时间,我们在用心做的更好!一起为恶意流量检测科研添砖加瓦!

八、数据集下载

请登录我们的实验室官网下载,东北林业大学网络安全实验室Maple Dateset站点:

https://maple.nefu.edu.cn/

九、联系我们

有任何问题或需要帮助,请随时与我们联系:

电子邮件:maple@nefu.edu.cn

GitHub:github.com/maple-nefu

QQ 群:631300176

十、欢迎引用和使用

请在使用我们的数据集时候请引用我们的官网发布的论文,谢谢!

相关推荐
weixin_468466851 天前
医学影像数据集汇总分享
深度学习·目标检测·数据集·图像分割·机器视觉·医学影像·ct影像
数据岛12 天前
大模型应用的数字能源数据集
大数据·数据分析·数据集·能源
知来者逆15 天前
Octo—— 基于80万个机器人轨迹的预训练数据集用于训练通用机器人,可在零次拍摄中解决各种任务
人工智能·机器学习·机器人·数据集·大语言模型
数据猎手小k16 天前
EmoAva:首个大规模、高质量的文本到3D表情映射数据集。
人工智能·算法·3d·数据集·机器学习数据集·ai大模型应用
数据猎手小k19 天前
GEOBench-VLM:专为地理空间任务设计的视觉-语言模型基准测试数据集
人工智能·语言模型·自然语言处理·数据集·机器学习数据集·ai大模型应用
dundunmm19 天前
论文阅读之方法: Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris
论文阅读·数据挖掘·数据集·聚类·单细胞·细胞聚类·细胞测序
数据猎手小k19 天前
BioDeepAV:一个多模态基准数据集,包含超过1600个深度伪造视频,用于评估深度伪造检测器在面对未知生成器时的性能。
人工智能·算法·数据集·音视频·机器学习数据集·ai大模型应用
数据猎手小k20 天前
HNTS-MRG 2024 Challenge:是一个包含200个头颈癌病例的磁共振图像及其标注的公开数据集,旨在推动AI在头颈癌放射治疗自动分割领域的研究。
人工智能·数据集·机器学习数据集·ai大模型应用
数据猎手小k1 个月前
OSPTrack:一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集,用于识别开源软件中的恶意行为。
数据集·开源软件·机器学习数据集·ai大模型应用
HyperAI超神经1 个月前
NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富
人工智能·开源·自动驾驶·数据集·多模态·化学光谱·neurips 2024