DIFT:用扩散模型+Transformer解决物联网入侵检测中的类别不平衡问题

物联网(IoT)设备数量激增,随之而来的网络安全威胁也日益严峻。入侵检测系统(IDS)作为守护物联网安全的关键技术,需要实时分析海量网络流量数据,及时发现潜在攻击。然而,实际场景中类别不平衡问题普遍存在------正常流量样本远远多于攻击样本,导致深度学习模型偏向多数类,少数攻击类的检测率严重下降。

DIFT: A Diffusion-Transformer for Intrusion Detection of IoT with Imbalanced Learning | Journal of Network and Systems Management | Springer Nature Link

现有的解决方法如重采样、代价敏感学习或生成对抗网络(GAN)各有局限:重采样易过拟合,GAN存在模式崩溃风险,难以生成高质量的少数类样本。针对这一挑战,提出了一种名为DIFT 的新型物联网入侵检测模型,结合了扩散模型(Diffusion Model)Transformer ,在平衡数据集的同时充分提取流量特征,显著提升了对少数攻击类的检测性能。该成果发表于Journal of Network and Systems Management(2025)。

DIFT的核心思想:生成+增强+提取

DIFT的整体框架分为三个阶段:

1. 扩散模型生成少数类样本,构建平衡数据集

扩散模型近年来在图像生成领域大放异彩,其通过前向加噪和反向去噪的马尔可夫过程学习数据分布,能生成高质量且多样化的样本。DIFT利用扩散模型学习少数攻击类流量的内在结构,生成逼真的合成样本,从而平衡各类别数量。相比GAN,扩散模型避免了模式崩溃,生成的数据更贴合真实分布。

2. Patching方法增强局部特征表示

物联网流量是一维时序数据。DIFT采用滑动窗口将原始序列分割成多个子序列片段(Patches),每个片段覆盖一个局部时间窗口。这种方法不仅保留了局部特征,还通过重叠窗口捕捉了片段间的关联,同时缩短了输入序列长度(从L降为N),降低了后续Transformer的计算复杂度。

3. Transformer提取局部与全局特征

处理后的Patch序列输入到时间序列Transformer中,利用多头自注意力机制动态提取局部细节和全局依赖。Transformer能自动为不同特征分配重要性权重,有效聚焦关键攻击模式,尤其擅长捕捉长距离时序相关性(如DDoS攻击的流量突发模式)。

实验亮点:在标准数据集上全面超越

研究团队在TON_IoTDS2OS两个公开物联网入侵检测数据集上进行了严格验证。这两个数据集均存在严重的类别不平衡问题(例如DS2OS中恶意控制类仅占总样本的0.25%)。

DS2OS数据集结果

  • DIFT总体准确率达到99.43%,远超LSTM(97.19%)、FT-Transformer(97.74%)等方法。

  • 对于最难检测的"恶意控制"类,DIFT的召回率达到65.75%(原始仅60.49%),F1分数79.48%。

  • 与使用GAN或VAE进行数据平衡的版本相比,DIFT在精确率、召回率、F1分数上均有0.2%~0.6%的提升。

TON_IoT数据集结果

  • DIFT准确率99.02% ,召回率98.98% ,F1分数98.99%

  • 对于样本极少的MITM(中间人攻击)类(仅占0.23%),召回率高达75.77%,ROC_AUC达0.9982,证明其对极端不平衡的鲁棒性。

  • 相比GAN平衡的版本,DIFT四项指标提升0.16%~0.52%。

消融实验:每个模块都不可或缺

  • 仅用特征提取模块(无生成和Patching)准确率98.64%。

  • 加入扩散模型生成后提升至99.28%。

  • 加入Patching后(无生成)提升至98.86%。

  • 三者全开达到最优99.43%,验证了各组件的有效性。

模型复杂度:兼顾性能与效率

DIFT的参数数量为4.71M,批推理时间337ms。与LSTM(2.62M但性能低)和ResNet-50(参数量大)相比,DIFT在准确率和复杂度之间取得了最佳平衡。Patching的引入显著减少了Transformer的token数量,降低了计算开销。

总结与展望

DIFT通过**"扩散模型生成 + Patching增强 + Transformer提取"**的双重特征增强机制,有效解决了物联网入侵检测中的类别不平衡问题,为少数类攻击的精准识别提供了新范式。未来,研究团队计划进一步优化生成阶段的效率,并探索边缘-云协同检测、流式学习等方向,以应对更复杂的多阶段攻击场景。

这项研究不仅提升了物联网安全防护能力,也为生成式模型与时序分析在网络安全领域的融合开辟了新思路。如果你对DIFT的技术细节感兴趣,欢迎阅读原论文或留言讨论!

相关推荐
深度学习lover2 分钟前
<数据集>yolo 垃圾识别<目标检测>
人工智能·深度学习·yolo·目标检测·计算机视觉·垃圾识别
LaughingZhu4 分钟前
Product Hunt 每日热榜 | 2026-04-25
人工智能·经验分享·深度学习·神经网络·产品运营
AI木马人17 分钟前
2.【多模型接入架构】如何同时接入GPT、Gemini、Claude并统一管理?(完整实现方案)
人工智能·gpt·深度学习·神经网络·自然语言处理
南宫惠泽23 分钟前
深度学习章节:模型的选择与训练.交叉验证.测试集, 诊断偏差与方差,正则化与偏差方差,建立基准性能水平
人工智能·深度学习
金融小师妹44 分钟前
AI多因子定价模型:美元强化与能源约束下 黄金反弹受限弹性解析
深度学习·svn·逻辑回归·能源
qq_411262421 小时前
四博 AI 智能音箱三模联网技术方案
物联网·ai
ManThink Technology2 小时前
KS31 4-20mA 模拟量采集器通过LoRaWAN 接入ThinkLink
人工智能·物联网
隔壁大炮2 小时前
Day02-04.张量点乘和矩阵乘法
人工智能·pytorch·深度学习·线性代数·算法·矩阵
Rubin智造社2 小时前
04月25日AI每日参考:谷歌豪掷400亿押注Anthropic,DeepSeek V4横空出世
大数据·人工智能·物联网·comfyui·deepseek v4·谷歌anthropic投资·meta亚马逊芯片
机器学习之心2 小时前
GA-Transformer模型回归+SHAP分析+新数据预测+多输出!深度学习可解释分析(附MATLAB代码)
深度学习·回归·transformer