UCI中Steel Plates Faults不平衡数据集处理

UCI中Steel Plates Faults不平衡数据集处理(二分类问题,研究Bumps缺陷)

第一步先把数据集格式NNA转换为CSV格式,最后一列为目标列,前面是特征列。本文主要研究Bumps缺陷,如果想研究其他缺陷,只需要替换df_binary = dffeature_cols + \["Bumps"]这一行代码中 "Bumps"]。

python 复制代码
import pandas as pd
df = pd.read_csv("Faults.NNA", 
                 sep=r"\s+", header=None)
feature_cols = [f"feature_{i+1}" for i in range(27)]
target_cols = ["Pastry", "Z_Scratch", "K_Scatch", "Stains", 
               "Dirtiness", "Bumps", "Other_Faults"]
df.columns = feature_cols + target_cols
# 选择研究Bumps缺陷
df_binary = df[feature_cols + ["Bumps"]]
df_binary.to_csv("steel_faults_bumps.csv", index=False)
print("已保存为steel_faults_bumps.csv,形状:", df_binary.shape)
print(df_binary.head())
相关推荐
隐于花海,等待花开26 分钟前
16.Python 常用第三方库概览 深度解析
python
我材不敲代码27 分钟前
Python 函数核心:位置参数与关键字参数详解
java·前端·python
风落无尘29 分钟前
第十一章《对齐与安全》 完整学习资料
python·安全·机器学习
Kratzdisteln31 分钟前
【无标题】
前端·python
hakesashou36 分钟前
python文件操作需要导入模块吗
python
wuxinyan12338 分钟前
工业级大模型学习之路029:解决双智能体调用数据库报错问题
数据库·人工智能·python·学习·智能体
SunnyDays10111 小时前
Python操作Excel批注:从基础添加到高级自定义的完整指南
开发语言·python·excel
独隅1 小时前
PyTorch自动微分模块:从原理到实战一
人工智能·pytorch·python
汤米粥2 小时前
python学习——核心语法三
java·python·学习
七老板的blog2 小时前
从持久化任务到多 Agent 协作
python·学习·ai