利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
SmallBambooCode18 分钟前
【Flask】在Flask应用中使用Flask-Limiter进行简单CC攻击防御
后端·python·flask
抱抱宝29 分钟前
Pyecharts之图表样式深度定制
python·信息可视化·数据分析
码界筑梦坊38 分钟前
基于Flask的哔哩哔哩评论数据可视化分析系统的设计与实现
python·信息可视化·flask·毕业设计
大懒猫软件1 小时前
如何有效使用Python爬虫将网页数据存储到Word文档
爬虫·python·自动化·word
大数据魔法师1 小时前
1905电影网中国地区电影数据分析(二) - 数据分析与可视化
python·数据分析
&白帝&1 小时前
JAVA JDK7时间相关类
java·开发语言·python
笔触狂放2 小时前
第一章 语音识别概述
人工智能·python·机器学习·语音识别
小炫y2 小时前
IBM 后端开发(二)
python
胡耀超3 小时前
13.快速构建领域知识库的完整指南:结合 ChatGPT 与 Python 提升效率
开发语言·python·chatgpt·知识图谱·知识库
CodeClimb4 小时前
【华为OD-E卷 - VLAN资源池 100分(python、java、c++、js、c)】
java·javascript·c++·python·华为od