利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

复制代码
import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

复制代码
import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
复制代码
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
Robot侠8 小时前
极简LLM入门指南4
大数据·python·llm·prompt·提示工程
等....9 小时前
Miniconda使用
开发语言·python
Java&Develop9 小时前
Aes加密 GCM java
java·开发语言·python
爱笑的眼睛1110 小时前
超越MSE与交叉熵:深度解析损失函数的动态本质与高阶设计
java·人工智能·python·ai
Rose sait11 小时前
【环境配置】Linux配置虚拟环境pytorch
linux·人工智能·python
过期动态11 小时前
JDBC高级篇:优化、封装与事务全流程指南
android·java·开发语言·数据库·python·mysql
一世琉璃白_Y12 小时前
pg配置国内数据源安装
linux·python·postgresql·centos
liwulin050612 小时前
【PYTHON】COCO数据集中的物品ID
开发语言·python
小鸡吃米…12 小时前
Python - XML 处理
xml·开发语言·python·开源
我赵帅的飞起12 小时前
python国密SM4加解密
python·sm4加解密·国密sm4加解密