Pandas读取包含多个工作表的Excel文件

文章目录

  • [1. 实战概述](#1. 实战概述)
  • [2. 实战步骤](#2. 实战步骤)
    • [2.1 查看Excel文件](#2.1 查看Excel文件)
    • [2.2 显示Excel文件包含的工作表名](#2.2 显示Excel文件包含的工作表名)
    • [2.3 读取指定工作表](#2.3 读取指定工作表)
    • [2.4 读取全部工作表](#2.4 读取全部工作表)
  • [3. 实战小结](#3. 实战小结)

1. 实战概述

  • 本次实战通过 Python 的 pandas 库读取本地 Excel 文件《智慧树AI智慧课程建设标准.xlsx》,依次查看文件结构、列出全部7个工作表名称,并分别读取单表与多表数据,初步探索各表内容,为后续课程资源数据的清洗、整合与分析奠定基础。

2. 实战步骤

2.1 查看Excel文件

  • 文件:E:\excelfiles\智慧树AI智慧课程建设标准.xlsx
  • 查看文件内容

2.2 显示Excel文件包含的工作表名

  • 执行代码

    python 复制代码
    import pandas as pd	
    path = 'E:/excelfiles/智慧树AI智慧课程建设标准.xlsx'	
    excel_file = pd.ExcelFile(path)
    print("工作表:", excel_file.sheet_names)
  • 结果说明 :该代码成功加载本地 Excel 文件,通过 pd.ExcelFile 获取文件信息并打印所有工作表名称。结果显示包含"总表"、"老师需提供资料汇总"等共7个工作表,说明数据结构清晰,适合后续多表读取与分析处理。

2.3 读取指定工作表

  • 执行代码

    python 复制代码
    dataframe1 = pd.read_excel(path, sheet_name=1, header=0)
    dataframe1.head(10)
  • 结果说明:该代码读取了Excel文件中索引为1的工作表,以第一行为列名,显示前10行数据。结果包含"资源类别"、"资源内容"等字段,部分列为"Unnamed",表明存在未命名列。数据主要为课程资源类型及是否需提供的信息,格式清晰,适合后续清洗与分析。

2.4 读取全部工作表

  • 执行代码

    python 复制代码
    dataframes = pd.read_excel(path, sheet_name=[0,1,2,3,4,5,6], header=0)
    print(f'工作表:{dataframes.keys()}')
    for key in dataframes.keys():
        print(f"\n--- 工作表 {key} ---")
        print(dataframes[key].head(3)) 
  • 结果说明:该代码成功读取Excel文件中7个工作表(索引0-6),并逐个输出前3行数据。各表内容涵盖课程概述、资源类型、教材信息、教学模块等,结构清晰,部分列名为"Unnamed",表明存在未命名列,适合后续数据清洗与整合分析。

3. 实战小结

  • 本次实战成功实现了对多工作表 Excel 文件的高效读取与初步探查。首先利用 pd.ExcelFile 快速获取所有工作表名称,确认文件包含"总表""老师需提供资料汇总"等7个逻辑清晰的子表;随后分别演示了读取单个工作表(如索引1的资源清单)和批量读取全部工作表的方法。通过 .head() 查看数据样例,发现部分列存在"Unnamed"命名问题,提示后续需进行列名清洗与标准化。整体流程展示了 pandas 在教育数据处理中的实用价值,为构建结构化课程知识库提供了可靠的数据导入方案,也为自动化分析多表关联信息打下坚实基础。
相关推荐
Dylan~~~2 小时前
Excel MCP Server:用自然语言操控 Excel,开启“对话式电子表格“新时代
excel·ai编程
catoop3 小时前
Excel 实战技巧:利用 OFFSET 统计 “标识行” 下方的数值总和
excel
郝YH是人间理想16 小时前
Pandas库DataFrame数据结构
数据结构·pandas
SHolmes18541 天前
Excel 公式解析:按条件去重计数
excel
用户298698530141 天前
告别手动复制:.NET 将网页数据一键导出为 Excel
后端·html·excel
竹林8181 天前
从零到精通:用 Python openpyxl 批量处理 Excel,彻底告别重复劳动
python·excel
郝YH是人间理想1 天前
Pandas库series数据结构
数据分析·pandas
潘达斯奈基~2 天前
Spark踩坑:如何优化pandas_udf中的多维数组传输效率
大数据·spark·pandas
rgb2gray2 天前
论文详解 | TWScan:基于收紧窗口的增强扫描统计,实现不规则形状空间热点精准检测
网络·人工智能·python·pandas·交通安全·出租车