利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

复制代码
import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

复制代码
import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
复制代码
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
念念01072 小时前
数学建模竞赛中评价类相关模型
python·数学建模·因子分析·topsis
云天徽上3 小时前
【数据可视化-94】2025 亚洲杯总决赛数据可视化分析:澳大利亚队 vs 中国队
python·信息可视化·数据挖掘·数据分析·数据可视化·pyecharts
☺����3 小时前
实现自己的AI视频监控系统-第一章-视频拉流与解码2
开发语言·人工智能·python·音视频
王者鳜錸3 小时前
PYTHON让繁琐的工作自动化-函数
开发语言·python·自动化
xiao助阵4 小时前
python实现梅尔频率倒谱系数(MFCC) 除了傅里叶变换和离散余弦变换
开发语言·python
麻辣清汤6 小时前
结合BI多维度异常分析(日期-> 商家/渠道->日期(商家/渠道))
数据库·python·sql·finebi
钢铁男儿6 小时前
Python 正则表达式(正则表达式和Python 语言)
python·mysql·正则表达式
钢铁男儿6 小时前
Python 正则表达式实战:解析系统登录与进程信息
开发语言·python·正则表达式
前端小趴菜056 小时前
python - range
python
☺����6 小时前
实现自己的AI视频监控系统-第一章-视频拉流与解码1
人工智能·python·音视频