UCI中Steel Plates Faults不平衡数据集处理

UCI中Steel Plates Faults不平衡数据集处理(二分类问题,研究Bumps缺陷)

第一步先把数据集格式NNA转换为CSV格式,最后一列为目标列,前面是特征列。本文主要研究Bumps缺陷,如果想研究其他缺陷,只需要替换df_binary = df[feature_cols + ["Bumps"]]这一行代码中 ["Bumps"]]。

python 复制代码
import pandas as pd
df = pd.read_csv("Faults.NNA", 
                 sep=r"\s+", header=None)
feature_cols = [f"feature_{i+1}" for i in range(27)]
target_cols = ["Pastry", "Z_Scratch", "K_Scatch", "Stains", 
               "Dirtiness", "Bumps", "Other_Faults"]
df.columns = feature_cols + target_cols
# 选择研究Bumps缺陷
df_binary = df[feature_cols + ["Bumps"]]
df_binary.to_csv("steel_faults_bumps.csv", index=False)
print("已保存为steel_faults_bumps.csv,形状:", df_binary.shape)
print(df_binary.head())
相关推荐
lulu121654407833 分钟前
Claude Code Harness架构技术深度解析:生产级AI Agent工程化实践
java·人工智能·python·ai编程
7年前端辞职转AI3 小时前
Python 文件操作
python·编程语言
龙文浩_3 小时前
AI梯度下降与PyTorch张量操作技术指南
人工智能·pytorch·python·深度学习·神经网络·机器学习·自然语言处理
呱牛do it3 小时前
企业级绩效考核系统设计与实现:基于FastAPI + Vue3的全栈解决方案
python·fastapi
7年前端辞职转AI3 小时前
Python 容器数据类型
python·编程语言
云霄IT3 小时前
安卓开发之java转dex再转smali
android·java·python
果汁华3 小时前
Typer:基于类型提示的现代Python CLI框架
开发语言·网络·python
Claw开发者3 小时前
第1课:用20行Python造出你的第一个AI Agent
python
7年前端辞职转AI3 小时前
Python 流程控制语句
python·编程语言
7年前端辞职转AI3 小时前
Python 运算符
python·编程语言