利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

复制代码
import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

复制代码
import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
复制代码
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
MZ_ZXD0011 小时前
springboot旅游信息管理系统-计算机毕业设计源码21675
java·c++·vue.js·spring boot·python·django·php
全栈老石1 小时前
Python 异步生存手册:给被 JS async/await 宠坏的全栈工程师
后端·python
梨落秋霜2 小时前
Python入门篇【模块/包】
python
阔皮大师3 小时前
INote轻量文本编辑器
java·javascript·python·c#
小法师爱分享3 小时前
StickyNotes,简单便签超实用
java·python
深蓝电商API3 小时前
处理字体反爬:woff字体文件解析实战
爬虫·python
开源技术3 小时前
Claude Opus 4.6 发布,100万上下文窗口,越贵越好用
人工智能·python
张3蜂3 小时前
深入理解 Python 的 frozenset:为什么要有“不可变集合”?
前端·python·spring
皮卡丘不断更3 小时前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”
人工智能·spring boot·python·ai编程
爱打代码的小林4 小时前
基于 MediaPipe 实现实时面部关键点检测
python·opencv·计算机视觉