pathlib:面向对象的文件系统路径

pathlib:面向对象的文件系统路径

pathlib官方介绍: Python3.4+内置的标准库,Object-oriented filesystem paths(面向对象的文件系统路径)

文章目录

  • pathlib:面向对象的文件系统路径
      • [1. 使用示例](#1. 使用示例)
        • [1.1 最常用:获取项目目录](#1.1 最常用:获取项目目录)
        • [1.2 遍历一个目录下指定文件](#1.2 遍历一个目录下指定文件)
        • [1.3 递归目录下的所有文件](#1.3 递归目录下的所有文件)
      • [2. 优势对比](#2. 优势对比)
      • [3. 基本介绍](#3. 基本介绍)
      • [4. 常见用法](#4. 常见用法)
      • [5. 参考资料](#5. 参考资料)

1. 使用示例

1.1 最常用:获取项目目录

os.path方法

python 复制代码
import os
project_dir = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
print(project_dir)  # /Users/root/Code/project
print(type(project_dir))  # <class 'str'>

pathlib方法

python 复制代码
from pathlib import Path
project_dir = Path(__file__).resolve().parent.parent
print(project_dir)  # /Users/root/Code/project
print(type(project_dir))  # <class 'pathlib.PosixPath'>
1.2 遍历一个目录下指定文件

os方法

python 复制代码
file_list = []
for file in os.listdir(csv_dir):
    if not file.endswith('.csv'):
        continue
    file_list.append(file)

pathlib方法

python 复制代码
from pathlib import Path
csv_dir = Path(csv_dir)
file_list = csv_dir.glob('*.csv')
1.3 递归目录下的所有文件

os方法

os.walk方法

python 复制代码
file_list = []
for root, dirs, files in os.walk('/Users/root/Code/project'):
  for f in files:
    if f.endswith('.py'):
      file_list.append(os.path.join(root, f))
python 复制代码
# glob方法
from glob import glob
file_list = glob('/Users/root/Code/project/**/*.py', recursive=True)

pathlib方法

python 复制代码
file_list = csv_dir.rglob('*.csv')  # 生成器对象

2. 优势对比

1、当需要获取多个层级目录时,os.path需要使用嵌套的写法,而pathlib则是正常的链式调用。pathlib的使用更加友好,使得路径对象更加明确。

2、os.path只用于基本的路径处理,如果需要其他操作如重命名/新建/复制文件等,需要用os下的其他模块。而pathlib可以用于处理路径相关操作,并且是一个轻量级的库。

3、os.path操作的路径时字符串,而pathlib操作的路径时对象。提供了对资源路径和资源命名结构的通用抽象。它把文件系统接口从os模块中隔离出来,打开了从应用层配置文件系统的大门。

换句话说,pathlib.Path这个接口代表的可以不仅是os的资源路径,还可以是HDFS的资源路径,RESTful API的资源路径。

3. 基本介绍

1、官网上给出的该模块提供表示文件系统路径的类,如下,其语义适用于不同的操作系统,路径类被分为提供纯计算操作而没有 I/O 的纯路径,以及从纯路径继承而来但提供 I/O 操作的具体路径。一般情况下,直接使用Path即可。

2、Path属性

4. 常见用法

  • 获取当前文件绝对路径
python 复制代码
from pathlib import Path
path = Path(__file__).resolve()
path
>>> /Users/root/Code/project/conf/path_conf.py
  • 获取当前文件的上级目录
python 复制代码
from pathlib import Path
path = Path(__file__).resolve()
path.parent
>>> /Users/root/Code/project/conf
path.parent.parent
>>> /Users/root/Code/project
  • 获取文件名
python 复制代码
from pathlib import Path
path = Path(__file__).resolve()
path.name
>>> path_conf.py
path.stem
>>> path_conf
path.suffix
>>> .py
  • 修改文件名,修改后缀
python 复制代码
from pathlib import Path
file = Path('data.csv')
new_file = file.with_name('result.csv')
new_file = file.with_suffix('.txt')
  • 路径拼接
python 复制代码
from pathlib import Path
root = Path(__file__).resolve().parent
# 方式1
conf_file = root / 'conf/path_conf.py'
# 方式2
conf_file = root / Path('conf/path_conf.py')
# 方式3
conf_file = root.joinpath('conf/path_conf.py')
  • 路径判断
python 复制代码
from pathlib import Path
path = Path(__file__).resolve()
path.is_file()  # 是否为文件
path.is_dir()  # 是否为目录
path.exists()  # 是否存在
  • 文件操作
python 复制代码
from pathlib import Path
file = Path(__file__).resolve()
file.touch()  # 新建文件
file.replace('../data.csv')  # 移动文件
file.unlink()  # 删除文件
  • 读取文件
python 复制代码
file = Path('../data/1.csv')
data = file.read_text()  # 读取文件
data = file.write_text()  # 写入文件
# 也可以作为普通路径使用
with open(file, 'r') as f:
  data = f.read()

5. 参考资料

https://docs.python.org/zh-cn/3/library/pathlib.html

https://www.cnblogs.com/heniu/p/12872604.html

https://zhuanlan.zhihu.com/p/87940289

https://zhuanlan.zhihu.com/p/33524938

https://www.jianshu.com/p/a820038e65c3

https://cloud.tencent.com/developer/article/1640696

相关推荐
hao_wujing30 分钟前
云计算时代携程的网络架构变迁
网络·架构·云计算
2301_8153893742 分钟前
【笔记】在虚拟机中通过apache2给一个主机上配置多个web服务器
linux·服务器·笔记
IT 古月方源1 小时前
关于 VRRP的详解
运维·网络·tcp/ip·网络安全·智能路由器
檀越剑指大厂1 小时前
【Linux系列】sed命令的深入解析:如何使用sed删除文件内容
linux·运维·服务器
不爱学英文的码字机器1 小时前
深入理解 Linux 文件时间戳:atime、mtime 和 ctime 的概念及应用
linux·运维·服务器
迷迭所归处2 小时前
Linux系统 —— 进程控制系列 - 进程的等待:wait 与 waitpid
linux·运维·服务器
周先森的怣忈2 小时前
RHCE(第二部分)-----第三章:shell条件测试
linux·rhce
AIGCnn2 小时前
jetson 无显示器配置WIFI
linux·jetson
yulingfeng592 小时前
Centos7 yum 报错“Could not resolve host: mirrorlist.centos.org; Unknown error“
linux·运维·centos
费曼乐园3 小时前
Zookeeper下面的conf目录下面的zoo.cfg
linux·分布式·zookeeper