1、 pandas是常见的python数据分析处理库,包括:数据结构、数据处理、缺失数据补充、时间序列化和数据可视化。
2、import pandas as pd 导入pandas库并起别名pd,方便调用pandas中的库函数,例如:pd.ExcelFile(path);
3、excel = pd.ExcelFile(path)读取path目录下的excel文件,并将相关文件相关信息存储到excel中,后续可以通过excel调用python中excel相关处理函数实现excel数据的处理。
4、excel.sheet_names可以获取excel表中的所有工作表的名称,存储到一个列表中。
5、os是python中的一个库文件,里面包含的函数主要作用是:文件操作、路径操作、环境变量、进程管理、权限管理和系统管理。
6、os.path.basename(path)获取路径下文件名称。路径下有多个文件,会导致混乱。可以通过listdir(path)获取一个路径下的所有文件名。
7、pip是python的包管理工具,通过pip可以安装python的相关安装包和依赖项。
8、下载pandas依赖库时可以通过修改镜像路径加快下载速度。
pip install pandas --index-url https://pypi.tuna.tsinghua.edu.cn/simple
9、当本地安装多个python时,使用pyCharmCommunity Edition 文件-》设置-》项目-》python解释器,进行数据解析时需要找到适合的python解释器。