UCI中Steel Plates Faults不平衡数据集处理

UCI中Steel Plates Faults不平衡数据集处理(二分类问题,研究Bumps缺陷)

第一步先把数据集格式NNA转换为CSV格式,最后一列为目标列,前面是特征列。本文主要研究Bumps缺陷,如果想研究其他缺陷,只需要替换df_binary = df[feature_cols + ["Bumps"]]这一行代码中 ["Bumps"]]。

python 复制代码
import pandas as pd
df = pd.read_csv("Faults.NNA", 
                 sep=r"\s+", header=None)
feature_cols = [f"feature_{i+1}" for i in range(27)]
target_cols = ["Pastry", "Z_Scratch", "K_Scatch", "Stains", 
               "Dirtiness", "Bumps", "Other_Faults"]
df.columns = feature_cols + target_cols
# 选择研究Bumps缺陷
df_binary = df[feature_cols + ["Bumps"]]
df_binary.to_csv("steel_faults_bumps.csv", index=False)
print("已保存为steel_faults_bumps.csv,形状:", df_binary.shape)
print(df_binary.head())
相关推荐
2301_8125396720 小时前
golang如何实现最小堆定时器_golang最小堆定时器实现总结
jvm·数据库·python
lyc878020 小时前
【Qwen3.5-2B-Base】本地模型部署和验证联动千帆api
大数据·python
m0_6908258220 小时前
检测三位随机数中重复数字的Python实现方法
jvm·数据库·python
谙弆悕博士20 小时前
GPT-5.5 Instant 免费开放背后的技术跃迁与战略阳谋
人工智能·python·gpt·chatgpt·学习方法·业界资讯
WL_Aurora20 小时前
备战蓝桥杯国赛【Day 6】
python·算法·蓝桥杯
阿正呀20 小时前
Redis如何处理数据持久化与主从切换的冲突_确保选主期间的数据安全落盘.txt
jvm·数据库·python
AI精钢20 小时前
把 Markdown 笔记变成可问答的知识图谱:本地 Graph RAG 工具 Kwipu 实测
人工智能·笔记·python·aigc·知识图谱
测绘第一深情20 小时前
在vscode中使用codex教程(个人安装经验)
数据结构·ide·vscode·python·算法·计算机视觉·编辑器
m0_4708576420 小时前
php中的foreach循环?_?PHP中foreach循环的语法结构与遍历数组对象详解.txt
jvm·数据库·python
彳亍10120 小时前
HTML5中Canvas局部刷新区域重绘的算法优化
jvm·数据库·python