Python Day8

@浙大疏锦行 PythonDay8.

内容:

  • 字典(字典对)
    *

    python 复制代码
    dict_test = dict(name='zhangsan', age=18)
  • 标签编码(离散特征 && 有顺序)

  • 连续特征的归一化和标准化处理

代码:

python 复制代码
# Question 1 dic
dict = {'Alice': 100, 'Bob': 200, 'Charlie': 300}

# Question 2 label-Code and 连续变量编码
import pandas as pd
import numpy as np

# 独热编码
def one_hot(data, columns):
    data = pd.get_dummies(data=data, columns=columns)
    return data
# 标签编码
def label_encoder(data, columns):
    if len(columns)  == 0:  # 处理异常情况
        return data
    value_index = list(range(len(columns))) # [1 2 3 4 5 6]
    mapping = dict(zip(columns, value_index))
    data[columns] = data[columns].map(mapping)
    return data
# 归一化
def min_max(data, columns):
    if len(columns)  == 0:  # 处理异常情况
        return data
    for column in columns:
        column_data = data[column]
        min_val = column_data.min()
        max_val = column_data.max()
        column_data = (column_data - min_val) / (max_val - min_val)
        data[column] = column_data
    return data

data = pd.read_csv("./data/heart.csv")
discrete_columns = []
continuous_columns = []
for column in data.columns:
    if data[column].dtype == 'object':
        discrete_columns.append(column)
    else:
        continuous_columns.append(column)

data = min_max(data, continuous_columns) # 归一化
# data = one_hot(data, discrete_columns) # 独热编码
data = label_encoder(data, discrete_columns) # 标签编码

print(data.head())
相关推荐
alwaysrun5 小时前
Python之文档自动上传至飞书云盘
python·飞书·uploader·云盘
如何原谅奋力过但无声5 小时前
【灵神高频面试题合集04-05】二分查找
数据结构·python·算法·leetcode
财经资讯数据_灵砚智能5 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月3日
大数据·人工智能·python·信息可视化·自然语言处理
西红柿炒番茄315 小时前
【Python】一个自动切换壁纸的python程序
开发语言·python
跨境数据猎手5 小时前
B 站 item_search_video 接口开发,搭建生产级视频搜索服务
大数据·爬虫·python
EnCi Zheng5 小时前
03ab-PyTorch安装教程 [特殊字符]
人工智能·pytorch·python
SmartBrain5 小时前
从Prompt工程到Harness工程:AI Agent落地之路
人工智能·python·华为·aigc
X566113 小时前
如何在 Laravel 中正确保存嵌套动态表单数据(主服务与子服务)
jvm·数据库·python
ZhengEnCi13 小时前
03ab-PyTorch安装教程 📚
python
狐狐生风14 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai