网络流数据集处理(深度学习数据处理基础)

一、数据集处理

处理数据集是一个文件夹 一个文件夹处理的,将原网络流数据集 放入一个文件夹 处理转换成 Json文件。(数据预处理)然后将这些文件处理成目标文件格式 再分割成训练集和测试集。每次运行只会处理一个文件夹。

  • 运行train.py 导入训练集训练模型,训练完之后进行保存模型参数。
  • 运行test.py 导入测试集测试模型,因此我们需要使用模型参数保存代码。

如果我们需要将数据集4倍交叉验证分为4个部分,3个训练集,一个测试集。那就相当于运行三次train.py分别运行导入不同的三个训练集即可。如果每个部分都需要当做一次测试集,那就重复4次就行。

二、后门攻击训练

为了进行有监督训练,我们需要带有标签的数据集。

我们认为数据集是带有标签的,

训练这里分为几个步骤:

将训练集每64个网络流当做一个批次。

(1)选择一个投毒目标yt,在当前训练集批次中随机选择20%个投毒目标,进行以下处理:

  • 上一次网络流+当前网络流生成 触发器掩码m
  • 当前网络流 与 掩码的m[n+1,2n]相加,训练模型分类为目标类别yt

(2)对于不投毒的训练集,用正常标签训练。

相关推荐
秋邱16 小时前
技术深耕:教育 AGI 的能力跃迁与安全加固
大数据·人工智能
一水鉴天16 小时前
整体设计 定稿 之16 三层智能合约体系实现设计和开发的实时融合
前端·人工智能·架构·智能合约
Peter_Monster16 小时前
LangChain到底是什么?
人工智能·langchain·大模型
HAPPY酷17 小时前
技术沟通的底层逻辑:用结构化方法提升协作效率
大数据·人工智能
java_logo17 小时前
Prometheus Docker 容器化部署指南
运维·人工智能·docker·容器·prometheus·ai编程
非著名架构师17 小时前
【光伏功率预测】EMD 分解 + PCA 降维 + LSTM 的联合建模与 Matlab 实现
人工智能·matlab·lstm·高精度光伏功率预测模型
Aspect of twilight17 小时前
KNN分类器与K-means无监督聚类详解
人工智能·机器学习·kmeans·knn
nn在炼金17 小时前
FlashAttention 1 深度解读:原理、价值、应用与实战
人工智能·算法
沐雪轻挽萤17 小时前
pytorch模型部署基础知识
人工智能·pytorch·python
极客BIM工作室17 小时前
从GAN到Sora:生成式AI在图像与视频领域的技术演进全景
人工智能·生成对抗网络·计算机视觉