在Python的数据处理读取Excel文件内容 常常使用库pandas中的read_excel()函数
该函数的格式和参数如下:
其实在这里面常用的参数就下面这几个,其他可以使用缺省值
- excel_writer:文件路径或现有的ExcelWriter。
- sheet_name:指的是包含DataFrame的工作表的名称。
- na_repr:缺失数据的表示。
- float_format:这是一个可选参数,用于格式化浮点数的字符串。
- columns:指定要写入的列。
- header:写出列名。如果给定字符串的列表,则假定它是列名的别名。
- index:写入索引。
- index_label:指定索引列的列标签。如果未指定,并且标题和索引为True,则使用索引名称。如果DataFrame使用MultiIndex,则应给出一个序列。
- startrow:默认值为0。它指的是要将DataFrame倾倒到的左上角单元格行。
- startcol:默认值为0。它指的是要将DataFrame倾倒到的左上角单元格列。
- engine:这是一个可选参数,用于指定要使用的引擎,可以是openpyxl或xlsxwriter。
- merge_cells:它返回布尔值,其默认值为True。将MultiIndex和分层行写为合并单元格。
- encoding:这是一个可选参数,用于对生成的excel文件进行编码。仅对xlwt是必需的。
- inf_rep:这也是一个可选参数,默认值为inf。通常表示无穷大。
- verbose:它返回一个布尔值。默认值为True。用于在错误日志中显示更多信息。
- freeze_panes:这也是一个可选参数,用于指定要冻结的基于一的最底行和最右列。
使用的数据为五粮液从2021年1月1日到2024年4月12日的交易行情,列数为序号、日期、开盘、收盘、最高、最低价格、成交量、成交额、振幅、涨跌幅、换手率等12个字段,793条记录。如下表:
使用该函数,读入文件中的execl表格数据,。
import pandas as pd
import os
mypath=r"D:\_____newyear \py\gp"
df=pd.read_csv(os.path.join(mypath+'\\'+'Wly_Data.xlsx'),encoding='utf-8')
df
数据读入后存入df变量中,通过df命令,可以直接查看数据内容。
其他的参数使用方法,欢迎读者自己测试,也可以下面咨询,谢谢!欢迎评论、点赞等。