正则表达式基础

学习re模块之前要先了解正则表达式更好的去使用和理解re模块

正则表达式是对字符串操作的一种逻辑公式，它会将事先定义好的一些特定字符，以及这些特定字符的组合，组成一个规则字符串，并且通过这个规则字符串表达对给定字符串的过滤逻辑。

一条正则表达式也称为一个模式，使用每个模式可以匹配指定文本中与表达式模式相同的字符串。正则表达式由 普通字符 、元字符 或 预定义字符集组成，其中普通字符包括大小写字母和数字。

元字符	说明
.	匹配任何一个字符(换行符除外)
^	匹配字符串的开头
$	匹配字符串的末尾
\|	连接多个子表达式，匹配与任意子表达式模式相同的字符串
\[\]	字符组，匹配其中出现的任意一个字符
-	连字符，匹配指定范围内的任意一个字符
?	匹配其前导字符 0次或 1次
*	匹配其前导字符 0次或多次
+	匹配其前导字符 1次或多次
{n}	匹配其前导字符 n 次
{m,n}	匹配其前导字符 m ~ n 次
()	分组，匹配子组
.*	贪婪匹配：表示任意匹配除换行符（\n、\r）之外的任何单个或多个字符, 当使用`.*`时，默认情况下，正则表达式引擎会尽可能多地匹配字符，这称为贪婪匹配它会匹配从字符串开头到正则表达式之间的所有内容
.*?	惰性匹配：懒惰量词告诉正则表达式引擎尽可能少地匹配字符。使用`.*?`时，引擎会尽可能少地匹配字符直到它找到匹配模式的剩余部分。

捕获组是正则表达式中的一个概念，它允许你从匹配的文本中提取子字符串。在正则表达式中，捕获组通过使用圆括号 () 来定义。