python的glob.glob()函数递归匹配文件或目录

python自带的glob模块用于查找符合特定规则的文件路径名。这个模块主要提供了一个函数glob(),它返回一个列表,包含了所有匹配特定模式的文件路径。跟pathlib.Path.glob是类似的功能,两者之间也有明显的区别。

  • glob.glob():是一个函数可以直接调用,函数返回一个list,包括匹配到的文件或目录名。
  • pathlib.Path.glob():需要先初始化Path类,然后调用glob函数,返回的是yield生成器,并且返回的是文件路径对象。超大型的文件目录可以建议使用pathlib.Path.glob。

glob.glob()函数介绍

使用时先导入glob模块:

复制代码
import glob

glog.glob函数源码如下:适配python3.12版本,不同的版本参数可能不同。

参数介绍:

1)pathname:一个字符串,表示要匹配的文件模式。

  • '*':匹配给定路径下所有的文件和目录(*不会递归查找子目录)。
  • '*.txt':匹配给定路径下所有以.txt结尾的文件(不会递归查找子目录)。
  • 'a/*.csv':匹配a目录下所有以.csv结尾的文件。
  • '**':匹配当前目录及其所有子目录下的文件和目录(**支持递归)。
  • '**/*.py':匹配当前目录及其所有子目录下所有以.py结尾的文件(**支持递归)。
  • '?.txt':匹配所有单个字符文件名并以.txt结尾的文件(例如a.txt,但不包括ab.txt)。
  • '[abc].txt':匹配a.txt、b.txt或c.txt。

2)root_dir:默认为None,使用当前目录;传入其他目录,比如"D:"表示在传入的目录中查找。

3)recursive:默认为False,参数为True和pathname包含**时,会递归地查找所有子目录中的文件。

4)Include_hidden:默认为False,参数为True时会查找隐藏的目录。

举例:

1)查找某个目录中的python文件

复制代码
for file in glob.glob('*.py',root_dir='D:\Python37\Scripts'):  
  print(file)

2)递归查找某个目录及所有子目录中的python文件

复制代码
for file in glob.glob('**/*.py',root_dir='D:\Python37\Scripts',
                      recursive=True):
  print(file)

3)查找某个目录中的隐藏的所有文件

复制代码
for file in glob.glob('*',root_dir='D:\Python37\Scripts',
                      include_hidden=True):
  print(file)

Path.glob(pattern)函数

返回与给定模式匹配的所有文件路径对象;这个方法返回的是一个生成器,可通过for循环访问。

参数pattern解释:pattern是一个字符串,用于指定要搜索的文件模式,有些类似于re模块对应的正则表达式,支持像通配符*,代表单个字符的?等。

以下是一些pattern参数的示例:

  • '*':匹配给定路径下所有的文件和目录(*不会递归查找子目录)。
  • '*.txt':匹配给定路径下所有以.txt结尾的文件(不会递归查找子目录)。
  • 'a/*.csv':匹配a目录下所有以.csv结尾的文件。
  • '**':匹配当前目录及其所有子目录下的文件和目录(**支持递归)。
  • '**/*.py':匹配当前目录及其所有子目录下所有以.py结尾的文件(**支持递归)。
  • '?.txt':匹配所有单个字符文件名并以.txt结尾的文件(例如a.txt,但不包括ab.txt)。
  • '[abc].txt':匹配a.txt、b.txt或c.txt。

测试代码:先初始化Path类,传入参数Path.cwd(),表示当前路径。

1)使用glob函数匹配特定的python文件。

复制代码
path_ins= Path(Path.cwd())
for i in path_ins.glob('*.py'):
  print(f'路径:{i}')

2)使用glob函数匹配所有的文件和目录。

复制代码
path_ins= Path(Path.cwd())
for i in path_ins.glob('*'):
  print(f'路径:{i}')

3)使用glob函数匹配当前目录及所有子目录下的所有文件和文件夹。

复制代码
path_ins= Path(Path.cwd())
for i in path_ins.glob('**'):
  print(f'路径:{i}')

共勉: 东汉·班固《汉书·枚乘传》:"泰山之管穿石,单极之绠断干。水非石之钻,索非木之锯,渐靡使之然也。"

-----指水滴不断地滴,可以滴穿石头;

-----比喻坚持不懈,集细微的力量也能成就难能的功劳。

----感谢读者的阅读和学习,谢谢大家。

相关推荐
databook5 小时前
Manim实现闪光轨迹特效
后端·python·动效
Juchecar6 小时前
解惑:NumPy 中 ndarray.ndim 到底是什么?
python
用户8356290780516 小时前
Python 删除 Excel 工作表中的空白行列
后端·python
Json_6 小时前
使用python-fastApi框架开发一个学校宿舍管理系统-前后端分离项目
后端·python·fastapi
数据智能老司机13 小时前
精通 Python 设计模式——分布式系统模式
python·设计模式·架构
数据智能老司机14 小时前
精通 Python 设计模式——并发与异步模式
python·设计模式·编程语言
数据智能老司机14 小时前
精通 Python 设计模式——测试模式
python·设计模式·架构
数据智能老司机14 小时前
精通 Python 设计模式——性能模式
python·设计模式·架构
c8i14 小时前
drf初步梳理
python·django
每日AI新事件14 小时前
python的异步函数
python