深度学习_2_数据处理


import os是一个Python的内置模块,用于与操作系统进行交互。通过导入os模块,你可以使用其中提供的函数和方法来执行各种与操作系统相关的任务。

python 复制代码
import os

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中

代码:

python 复制代码
import os

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中
data_file = os.path.join('..', 'date', 'house_tiny.csv')##路径名
with open(data_file, 'w') as f:

##第一个参数是文件路径(在此处为 data_file),第二个参数 'w' 表示以写入模式打开文件。如果文件不存在,它将被创建;如果文件已存在,它将被覆盖。
    f.write("NumRooms,Alley,Price\n")
    f.write("NA,Pave,127500\n")
    f.write("2,NA,127500\n")
    f.write("NA,NA,127500\n")


python 复制代码
import os

import pandas as pd
import numpy as np

os.makedirs(os.path.join('..', 'date'), exist_ok=True)##将创建一个名为date的文件夹,位于当前目录的上一级目录中
data_file = os.path.join('..', 'date', 'house_tiny.csv')##路径名
# with open(data_file, 'w') as f:
# ##第一个参数是文件路径(在此处为 data_file),第二个参数 'w' 表示以写入模式打开文件。如果文件不存在,它将被创建;如果文件已存在,它将被覆盖。
#     f.write("NumRooms,Alley,Price\n")
#     f.write("NA,Pave,127500\n")
#     f.write("2,NA,127500\n")
#     f.write("NA,NA,127500\n")
data = pd.read_csv(data_file)
print(data)
inputs, outputs = data.iloc[:,0:2], data.iloc[:, 2]#inputs所有行前两列,out所有行的第三列
# inputs = inputs.fillna(inputs.mean().astype(float))
numeric_columns = inputs.select_dtypes(include=[np.number]).columns  # 选择数值型的列
inputs[numeric_columns] = inputs[numeric_columns].fillna(inputs[numeric_columns].mean())  # 对数值型列进行填充

print(inputs)

数据填充,已存在数据的均值

相关推荐
lijianhua_97127 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
EDPJ7 小时前
当图像与文本 “各说各话” —— CLIP 中的模态鸿沟与对象偏向
深度学习·计算机视觉
蔡俊锋7 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语7 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背7 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao7 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农7 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年7 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
ai生成式引擎优化技术8 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能
帐篷Li8 小时前
9Router:开源AI路由网关的架构设计与技术实现深度解析
人工智能