深度学习_2_数据处理


import os是一个Python的内置模块,用于与操作系统进行交互。通过导入os模块,你可以使用其中提供的函数和方法来执行各种与操作系统相关的任务。

python 复制代码
import os

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中

代码:

python 复制代码
import os

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中
data_file = os.path.join('..', 'date', 'house_tiny.csv')##路径名
with open(data_file, 'w') as f:

##第一个参数是文件路径(在此处为 data_file),第二个参数 'w' 表示以写入模式打开文件。如果文件不存在,它将被创建;如果文件已存在,它将被覆盖。
    f.write("NumRooms,Alley,Price\n")
    f.write("NA,Pave,127500\n")
    f.write("2,NA,127500\n")
    f.write("NA,NA,127500\n")


python 复制代码
import os

import pandas as pd
import numpy as np

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中
data_file = os.path.join('..', 'date', 'house_tiny.csv')##路径名
# with open(data_file, 'w') as f:
# ##第一个参数是文件路径(在此处为 data_file),第二个参数 'w' 表示以写入模式打开文件。如果文件不存在,它将被创建;如果文件已存在,它将被覆盖。
#     f.write("NumRooms,Alley,Price\n")
#     f.write("NA,Pave,127500\n")
#     f.write("2,NA,127500\n")
#     f.write("NA,NA,127500\n")
data = pd.read_csv(data_file)
print(data)
inputs, outputs = data.iloc[:,0:2], data.iloc[:, 2]#inputs所有行前两列,out所有行的第三列
# inputs = inputs.fillna(inputs.mean().astype(float))
numeric_columns = inputs.select_dtypes(include=[np.number]).columns  # 选择数值型的列
inputs[numeric_columns] = inputs[numeric_columns].fillna(inputs[numeric_columns].mean())  # 对数值型列进行填充

print(inputs)

数据填充,已存在数据的均值

相关推荐
新智元1 小时前
阿里王牌 Agent 横扫 SOTA,全栈开源力压 OpenAI!博士级难题一键搞定
人工智能·openai
新智元1 小时前
刚刚,OpenAI/Gemini 共斩 ICPC 2025 金牌!OpenAI 满分碾压横扫全场
人工智能·openai
机器之心1 小时前
OneSearch,揭开快手电商搜索「一步到位」的秘技
人工智能·openai
阿里云大数据AI技术2 小时前
2025云栖大会·大数据AI参会攻略请查收!
大数据·人工智能
YourKing2 小时前
yolov11n.onnx格式模型转换与图像推理
人工智能
sans_2 小时前
NCCL的用户缓冲区注册
人工智能
sans_2 小时前
三种视角下的Symmetric Memory,下一代HPC内存模型
人工智能
算家计算3 小时前
模糊高清修复真王炸!ComfyUI-SeedVR2-Kontext(画质修复+P图)本地部署教程
人工智能·开源·aigc
虫无涯3 小时前
LangSmith:大模型应用开发的得力助手
人工智能·langchain·llm
算家计算3 小时前
DeepSeek-R1论文登《自然》封面!首次披露更多训练细节
人工智能·资讯·deepseek