1.正则表达式(regular expression)
(1)定义:对于有规律的事物,如手机号,身份证号等,用符号表示一些重复出现、大小写、开头或结尾有特点
(2)应用场景
linux三剑客 grep awk sed
python golong java
过滤有规律的东西(日志文件)或无规律
(3)分类
- 基础正则
^ $ ^$ . * .* [a-z] [^abc]
2.扩展
- | {} () ?
(4)正则与通配符的区别
分类 用途 支持的命令或工具
正则 三剑客、高级语言、过滤信息 awk grep sed
通配符 匹配文件名 linux下大部分命令
2.基础正则
(1)^ 以什么开头
(2)$ 以什么结尾
(3)^$ 空行,表示什么都没有
应用:去除文件中的空行grep -v '^$' filename.txt (-v 反转匹配)
(4). 任意一个字符
注意:(1) . 不匹配空行
(2)匹配文件中以 . 结尾的行
grep -n '.$' 1216.txt (陷阱,会匹配任意字符结尾的行)
grep -n '\.$' 1216.txt 加转义字符
(5)* *前一个字符连续出现0次或0次以上
(6).* 表示所有内容,任意内容
举例:匹配文件中任意字符开头,以最后一个m结束的行,不管到最后一个m本行是否结束,不排除空格
注意:正则表达式中.* 或 *在使用时,会表现出贪婪性,会尽可能多的匹配所有满足条件的字符,所以上述会匹配到最后一个m才结束