利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

一、样例理解

复制代码
import pandas as pd
import numpy as np

# 创建测试数据
feature_names = ['col1 ', 'col2', 'col3', 'col4', 'col5', 'col6']
values = np.random.randint(20, size=(10,6))

dataset = pd.DataFrame(data = values, columns = feature_names)

print("转换前的数据为\n",dataset)
print(dataset.dtypes)

print("======================================================")

# 获取dataframe格式数据的特征名称
feature_names = list(dataset)
print("特征名称为\n",feature_names)

# 将特征值转为分类数据
for col in feature_names:
    dataset[col] = dataset[col].astype('category',copy=False)

print("转换后的数据为\n",dataset)
print(dataset.dtypes)

二、dataframe格式数据样例说明

复制代码
import pandas as pd
import numpy as np
test1 = pd.read_csv('./test.csv',encoding='utf-8',index_col=0)
test1
复制代码
# 获取特征名称
features = [x for x in test3.columns if x not in ['pos','LABEL']]

#将特征数据类型转换为分类数据
for col in features:
    test2[col] = test2[col].astype('category',copy=False)
相关推荐
曲幽9 小时前
FastAPI + PostgreSQL 实战:从入门到不踩坑,一次讲透
python·sql·postgresql·fastapi·web·postgres·db·asyncpg
用户83562907805114 小时前
使用 C# 在 Excel 中创建数据透视表
后端·python
码路飞17 小时前
FastMCP 实战:一个 .py 文件,给 Claude Code 装上 3 个超实用工具
python·ai编程·mcp
dev派19 小时前
AI Agent 系统中的常用 Workflow 模式(2) Evaluator-Optimizer模式
python·langchain
前端付豪21 小时前
AI 数学辅导老师项目构想和初始化
前端·后端·python
用户03321266636721 小时前
将 PDF 文档转换为图片【Python 教程】
python
悟空爬虫1 天前
UV实战教程,我啥要从Anaconda切换到uv来管理包?
python
dev派1 天前
AI Agent 系统中的常用 Workflow 模式(1)
python·langchain
明月_清风1 天前
从“能用”到“专业”:构建生产级装饰器与三层逻辑拆解
后端·python
曲幽1 天前
数据库实战:FastAPI + SQLAlchemy 2.0 + Alembic 从零搭建,踩坑实录
python·fastapi·web·sqlalchemy·db·asyncio·alembic