使用CSV模块读取CSV文件--含代码

使用CSV某块读取CSV文件

` CSV文件开头有多行说明,有汉字,有效数据是ASCII,直接读取时数据无法被代码使用

导入模块:

复制代码
import os # 用于遍历目录中的文件。
import numpy as np # 用于处理 numpy 矩阵(虽然在这个示例中主要用 pandas)。
import matplotlib.pyplot as plt # 用于画图,本文未使用

读取单个CSV文件

定义 read_csv_to_numpy_matrix 函数:

  • file_path 是单个 CSV 文件的完整路径。
  • start_row 从指定行开始读取。

初始化列表:

复制代码
data = [] 用于存储单个 CSV 文件的数据矩阵。

打开文件、关闭文件

复制代码
with open(file_path, mode='r', newline='', encoding='utf-8') as file:
file.close()

读取文件

复制代码
csv_reader = csv.reader(file)

跳过标题行

复制代码
header = next(csv_reader)

读取指定行的内容

复制代码
for current_row, row in enumerate(csv_reader, start=1):
    if current_row >= start_row: # 从指定行开始读取数据
        data.append([float(x) for x in row])

将数据转换为 numpy 矩阵

复制代码
matrix = np.array(data)

返回数据

复制代码
return matrix

读取目录下所有CSV文件

定义 read_csv_files_to_dict 函数:

  • directory_path 是包含 CSV 文件的目录路径。
  • start_row 从指定行开始读取。

初始化字典:

复制代码
matrices = {} 用于存储每个 CSV 文件的数据矩阵。

遍历目录中的文件:

使用 os.listdir(directory_path) 获取目录中的所有文件。

检查文件名是否以 .csv 结尾。

读取和处理 CSV 文件:

使用 read_csv_to_numpy_matrix(file_path, start_row) 读取 CSV 文件到 DataFrame。

存储矩阵到字典:

将矩阵放入 matrices 字典中,键为文件名。

返回字典:

函数返回包含所有 CSV 文件数据矩阵的字典。

示例用法:

调用 read_csv_files_to_dict 函数,并将结果存储在 csv_matrices 变量中。

遍历字典并打印每个文件名及其对应的 numpy 矩阵。

注意事项

字典中的键是文件名(包括扩展名)。如果你希望不包括扩展名,可以在存储到字典时进行相应处理。

完整代码

python读取csv文件及读取多个文件,将字符串转成numpy

相关推荐
网上邻居YY1 分钟前
深度学习DL 之 安装PyTorch·GPU版、CUDA(本人Anaconda、Python、PyCharm已提前安装好)
pytorch·经验分享·python·深度学习·pycharm·学习方法
AI、少年郎3 分钟前
如何用个人电脑快速训练自己的语言模型?MiniMind 全流程实战指南
人工智能·python·神经网络·ai·自然语言处理·大模型·模型训练微调
枫叶林FYL6 分钟前
【Python高级工程与架构实战】项目四 现代ETL编排平台:Airflow + dbt + Snowflake 企业级数据管道架构与实现
人工智能·python·架构·etl
源码之屋7 分钟前
计算机毕业设计:Python天气数据采集与可视化分析平台 Django框架 线性回归 数据分析 大数据 机器学习 大模型 气象数据(建议收藏)✅
人工智能·python·深度学习·算法·django·线性回归·课程设计
捧月华如12 分钟前
React vs Vue vs Angular:三大前端框架深度对比
python·github
AI_Claude_code13 分钟前
安全与合规核心:匿名化、日志策略与法律风险规避
网络·爬虫·python·tcp/ip·安全·http·网络爬虫
杜子不疼.14 分钟前
用 Python 实现 RAG:从文档加载到语义检索全流程
开发语言·人工智能·python
Eiceblue15 分钟前
Python 如何实现 Excel 数据分列?一列拆分为多列
python·microsoft·excel
不是株16 分钟前
FastAPI
python·fastapi