DIFT:用扩散模型+Transformer解决物联网入侵检测中的类别不平衡问题

物联网(IoT)设备数量激增,随之而来的网络安全威胁也日益严峻。入侵检测系统(IDS)作为守护物联网安全的关键技术,需要实时分析海量网络流量数据,及时发现潜在攻击。然而,实际场景中类别不平衡问题普遍存在------正常流量样本远远多于攻击样本,导致深度学习模型偏向多数类,少数攻击类的检测率严重下降。

DIFT: A Diffusion-Transformer for Intrusion Detection of IoT with Imbalanced Learning | Journal of Network and Systems Management | Springer Nature Link

现有的解决方法如重采样、代价敏感学习或生成对抗网络(GAN)各有局限:重采样易过拟合,GAN存在模式崩溃风险,难以生成高质量的少数类样本。针对这一挑战,提出了一种名为DIFT 的新型物联网入侵检测模型,结合了扩散模型(Diffusion Model)Transformer ,在平衡数据集的同时充分提取流量特征,显著提升了对少数攻击类的检测性能。该成果发表于Journal of Network and Systems Management(2025)。

DIFT的核心思想:生成+增强+提取

DIFT的整体框架分为三个阶段:

1. 扩散模型生成少数类样本,构建平衡数据集

扩散模型近年来在图像生成领域大放异彩,其通过前向加噪和反向去噪的马尔可夫过程学习数据分布,能生成高质量且多样化的样本。DIFT利用扩散模型学习少数攻击类流量的内在结构,生成逼真的合成样本,从而平衡各类别数量。相比GAN,扩散模型避免了模式崩溃,生成的数据更贴合真实分布。

2. Patching方法增强局部特征表示

物联网流量是一维时序数据。DIFT采用滑动窗口将原始序列分割成多个子序列片段(Patches),每个片段覆盖一个局部时间窗口。这种方法不仅保留了局部特征,还通过重叠窗口捕捉了片段间的关联,同时缩短了输入序列长度(从L降为N),降低了后续Transformer的计算复杂度。

3. Transformer提取局部与全局特征

处理后的Patch序列输入到时间序列Transformer中,利用多头自注意力机制动态提取局部细节和全局依赖。Transformer能自动为不同特征分配重要性权重,有效聚焦关键攻击模式,尤其擅长捕捉长距离时序相关性(如DDoS攻击的流量突发模式)。

实验亮点:在标准数据集上全面超越

研究团队在TON_IoTDS2OS两个公开物联网入侵检测数据集上进行了严格验证。这两个数据集均存在严重的类别不平衡问题(例如DS2OS中恶意控制类仅占总样本的0.25%)。

DS2OS数据集结果

  • DIFT总体准确率达到99.43%,远超LSTM(97.19%)、FT-Transformer(97.74%)等方法。

  • 对于最难检测的"恶意控制"类,DIFT的召回率达到65.75%(原始仅60.49%),F1分数79.48%。

  • 与使用GAN或VAE进行数据平衡的版本相比,DIFT在精确率、召回率、F1分数上均有0.2%~0.6%的提升。

TON_IoT数据集结果

  • DIFT准确率99.02% ,召回率98.98% ,F1分数98.99%

  • 对于样本极少的MITM(中间人攻击)类(仅占0.23%),召回率高达75.77%,ROC_AUC达0.9982,证明其对极端不平衡的鲁棒性。

  • 相比GAN平衡的版本,DIFT四项指标提升0.16%~0.52%。

消融实验:每个模块都不可或缺

  • 仅用特征提取模块(无生成和Patching)准确率98.64%。

  • 加入扩散模型生成后提升至99.28%。

  • 加入Patching后(无生成)提升至98.86%。

  • 三者全开达到最优99.43%,验证了各组件的有效性。

模型复杂度:兼顾性能与效率

DIFT的参数数量为4.71M,批推理时间337ms。与LSTM(2.62M但性能低)和ResNet-50(参数量大)相比,DIFT在准确率和复杂度之间取得了最佳平衡。Patching的引入显著减少了Transformer的token数量,降低了计算开销。

总结与展望

DIFT通过**"扩散模型生成 + Patching增强 + Transformer提取"**的双重特征增强机制,有效解决了物联网入侵检测中的类别不平衡问题,为少数类攻击的精准识别提供了新范式。未来,研究团队计划进一步优化生成阶段的效率,并探索边缘-云协同检测、流式学习等方向,以应对更复杂的多阶段攻击场景。

这项研究不仅提升了物联网安全防护能力,也为生成式模型与时序分析在网络安全领域的融合开辟了新思路。如果你对DIFT的技术细节感兴趣,欢迎阅读原论文或留言讨论!

相关推荐
互联网江湖2 小时前
鹿客科技IPO,陈彬不想“站在门外”
大数据·人工智能·物联网
沃达德软件2 小时前
AI视频监控:智慧场馆安防升级
图像处理·人工智能·深度学习·目标检测·机器学习·计算机视觉·目标跟踪
csg11072 小时前
PIC单片机高阶实战(三):PIC32MX电平变化中断输入
单片机·嵌入式硬件·物联网
梁山1号3 小时前
【LCD屏幕相关】针对中景园
stm32·单片机·物联网
小超同学你好3 小时前
Transformer 13. DeepSeek LLM 架构解析:与 LLaMA 以及 Transformer 架构对比
人工智能·语言模型·架构·transformer·llama
Kingexpand_com3 小时前
物联网APP开发实战:如何打造用户真正愿意用的智能硬件伴侣
物联网·小程序·app·智能硬件·物联网app定制开发
Zevalin爱灰灰4 小时前
零基础入门学用物联网(ESP8266) 第一部分 基础知识篇(二)
单片机·物联网·嵌入式·esp8266
翱翔的苍鹰4 小时前
LangChain是一个主流的大语言模型(LLM)应用开发框架,核心功能是连接大模型与外部资源/工具。
网络·人工智能·python·深度学习·语言模型
写Cpp的小黑黑4 小时前
MQTT 协议中的 Last Will、Message Expiration 和 Retained Messages 机制详解
物联网