（python）正则表达式进阶

Marst Code2023-12-22 19:48

正则表达式（Regular Expression）是一种强大的文本模式匹配工具，它可以用于在字符串中进行搜索、替换和提取等操作。正则表达式由特定的字符和符号组成，用于定义匹配规则。

.：匹配任意单个字符。

[ ]：匹配指定字符集合中的任意一个字符。例如，[aeiou] 匹配任意一个元音字母。

[^ ]：匹配除指定字符集合外的任意一个字符。例如，[^0-9] 匹配任意非数字字符。

*：匹配前面的模式零次或多次。

+：匹配前面的模式一次或多次。

?：匹配前面的模式零次或一次。

{n}：匹配前面的模式恰好 n 次。

{n,}：匹配前面的模式至少 n 次。

^：匹配字符串的开头。

$：匹配字符串的结尾。

\b：匹配单词边界。

( )：用于将一系列模式组合为一个单元，以便进行分组或捕获。

(?: )：用于仅进行分组，不进行捕获。

\：用于转义特殊字符，使其失去原有的特殊含义。例如，\. 匹配句点字符。

正则表达式的语法相对复杂，处理复杂的模式时可能会变得非常混乱。因此，在编写复杂的正则表达式之前，建议先测试和验证模式的正确性。同时，正则表达式的性能也可能受到影响，因此在处理大量数据时要谨慎使用。

如果只是日常的使用，可以参照正则提取的基础篇http://t.csdnimg.cn/Lu7XZ