UCI中Steel Plates Faults不平衡数据集处理

UCI中Steel Plates Faults不平衡数据集处理(二分类问题,研究Bumps缺陷)

第一步先把数据集格式NNA转换为CSV格式,最后一列为目标列,前面是特征列。本文主要研究Bumps缺陷,如果想研究其他缺陷,只需要替换df_binary = df[feature_cols + ["Bumps"]]这一行代码中 ["Bumps"]]。

python 复制代码
import pandas as pd
df = pd.read_csv("Faults.NNA", 
                 sep=r"\s+", header=None)
feature_cols = [f"feature_{i+1}" for i in range(27)]
target_cols = ["Pastry", "Z_Scratch", "K_Scatch", "Stains", 
               "Dirtiness", "Bumps", "Other_Faults"]
df.columns = feature_cols + target_cols
# 选择研究Bumps缺陷
df_binary = df[feature_cols + ["Bumps"]]
df_binary.to_csv("steel_faults_bumps.csv", index=False)
print("已保存为steel_faults_bumps.csv,形状:", df_binary.shape)
print(df_binary.head())
相关推荐
蓑笠翁0013 小时前
Django REST Framework 全面指南:从模型到完整API接口开发
后端·python·django
感谢地心引力3 小时前
【Python】基于 PyQt6 和 Conda 的 PyInstaller 打包工具
数据库·python·conda·pyqt·pyinstaller
xiaohanbao095 小时前
Transformer架构与NLP词表示演进
python·深度学习·神经网络
love530love5 小时前
【笔记】 Podman Desktop 中部署 Stable Diffusion WebUI (GPU 支持)
人工智能·windows·笔记·python·容器·stable diffusion·podman
程序员晚枫6 小时前
Python 3.14正式发布!这5大新特性太炸裂了
python
先做个垃圾出来………6 小时前
SortedList
python
这里有鱼汤6 小时前
从DeepSeek到Kronos,3个原因告诉你:Kronos如何颠覆传统量化预测
后端·python·aigc
晓宜6 小时前
Java25 新特性介绍
java·python·算法
深栈6 小时前
机器学习:决策树
人工智能·python·决策树·机器学习·sklearn