目录
[1.1 正则表达式概述](#1.1 正则表达式概述)
[1.2 常用选项](#1.2 常用选项)
[1 基础正则表达式](#1 基础正则表达式)
[2 扩展元字符](#2 扩展元字符)
1.正则表达式
1.1 正则表达式概述
正则表达式:通常用于判断语句中,用来检查某一字符串是否满足某一格式。
# 正则表达式是由普通字符与元字符组成.
#普通字符包括大小写字母、数字、标点符号及一些其他符号.
#元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符或表达式)在目标对象中的出现模式.
注意:linux命令行的常用通配符有* ? [...]:匹配文件或目录名;正则表达式:用来匹配文件内容,[.\n]表示匹配所有字符.
通配符:作用范围 匹配文件/目录名
正则表达式:作用范围 匹配文件内容
基础正则表达式常见元字符有:(支持的工具:grep、egrep、sed、 awk )
1.2 常用选项
1 基础正则表达式
(支持的工具:grep、egrep、sed、awk)
. 代表除了\n意外的任意字符
* 匹配*前面的字符或表达式任意次数(包括0次 1次 或多次)
.* 匹配任意字符大于等于0次
[xxx]匹配中括号里的列表中的任意一个字符
[xxx]*匹配中括号里的列表中任意字符大于等于0次
[^xxx]匹配除了中括号里的列表中的任意一个字符
[^0-9]匹配所有非数字的字符
[^a-zA-Z]匹配所有非大小写字母的字符
\{n\}匹配{n}前面的字符或表达式 n 次;grep必须加\;egrep不用加\.
\{n,\}匹配{n}前面的字符或表达式至少 n 次(>=n次)
\{n,m\} 匹配{n}前面的字符或表达式 n至m 次(大于等于n次且小于等于m次)
grep必须加\;egrep不用加\.
使用egrep不用加反斜杠;egrep等于grep -E
\w :匹配包括下划线的任何单词字符。
\W :匹配任何非单词字符。等价于"[^A-Za-z0-9_]"。
grep需搭配-P使用
\d :匹配一个数字字符。
\D :匹配一个非数字字符。等价于 [^0-9]。
grep需搭配-P使用
\s :空白符。
\S :非空白符
grep需搭配-P使用
2 扩展元字符
(支持的工具:egrep、awk)grep -E sed -r
+ 匹配+前面的字符或表达式至少1次(大于等于1次{1,})
? 匹配?前面的字符或表达式0次或1次({0,1})
() 将()里面的表达式作为一个整体
| 以或的方式匹配字符串