利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

复制代码
import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

复制代码
import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
复制代码
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
爱上纯净的蓝天5 分钟前
30 分钟上手 AtomCode:用它写一个 Python 批量整理文件/改名/生成报告小工具(新手教程)
python·开源·自动化脚本·atomcode·ai 编码助手
郝学胜-神的一滴5 分钟前
力扣 662 :二叉树最大宽度
java·数据结构·c++·python·算法·leetcode·职场和发展
2301_764441336 分钟前
基于Stackelberg博弈的分散式库存模型
python·算法·数学建模
是Dream呀9 分钟前
通道注意力机制|Channel Attention Neural Network
人工智能·python·深度学习
yaoxin52112311 分钟前
430. Java 日期时间 API - 时间计算 Temporal 包
java·前端·python
RSTJ_162516 分钟前
PYTHON+AI LLM DAY SEVENTY
人工智能·python·深度学习
财经资讯数据_灵砚智能20 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月8日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m沐沐25 分钟前
数据集的六种填充方法——下(使用众数填充+使用逻辑回归填充+使用随机森林填充)
python·随机森林·机器学习·pycharm·逻辑回归
TonyLee01726 分钟前
AutoDL租卡记录
服务器·python
m沐沐27 分钟前
【机器学习】7 种分类模型实战(逻辑回归→随机森林→SVM→AdaBoost→朴素贝叶斯→XGBoost→神经网络)
人工智能·pytorch·python·随机森林·机器学习·分类·逻辑回归