【Linux】正则表达式的使用

正则表达式（Regular Expression，RE）

正则表达式是通过一些特殊字符的排列，用以字串处理的表达式，正则表达式本身并不是一个工具程序，而实一个字串处理的标准依据，如果想要以正则表达式的方式处理字串，就需要使用支持正则表达式的工具程序，如vi，grep，sed，awk等

正则表达式可以在文本中查找、替换、提取和验证特定的模式

以行为单位来进行字串的处理行为

不同的语系将会影响到正则表达式的输出结果：由于不同语系的编码数据并不相同，所以就会造成数据选择结果的不同。

LANG = C时：0 1 2 3 4 ... A B C D ... Z a b c d ... z

LANG = zh_TW时：0 1 2 3 4 ... a A b B c C d D ... z Z

一般我们在练习正则表达式时，使用的是相容于POSIX的标准，因此使用c这个语系

普通字符包括没有显示指定为元字符的所有可打印和不可打印字符，这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号

有特殊含义的字符，若要匹配这些特殊字符，必须首先使字符转义，即将反斜杠字符\放在他们前面

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配

*和+限定符都是贪婪的，因为他们会尽可能多地匹配文字，只有在他们后面加上一个?就可以实现非贪婪或最小匹配

能够将正则表达式固定到行首或行尾

不能将限定符与定位符一起使用，

用圆括号()将所有选择项括起来，相邻的选择项之间用|分隔，但使用圆括号会有一个副作用，使相关的匹配会被缓存，可以使用非捕获元来消除这种副作用