正则表达式扩展应用

使用扩展正则表达式 egrep

首先来看一条前面章节学习过的用来去除空白行和注释行的指令:

bash 复制代码
grep -v '^$' regular_express.txt |grep -v '^#'

可见,通常的 grep 指令需要使用两次管线命令。那么如果使用扩展正则表达式,则可以简化为:

bash 复制代码
egrep -v '^$|^#' regular_express.txt

利用支持扩展正则表达式的 egrep 与特殊字符 | 的组合功能来间隔两组字符串,如此一来,可以极大地化简指令。

此外,也可以使用 grep -E 来使用扩展正则表达式,不过一般更建议直接使用 egrepgrep -Eegrep 之间类似命令别名的关系。

扩展规则(一)

回忆一下,在非扩展正则表达式中,我们使用 * 来表示任意个重复字符(零至无穷多个):

bash 复制代码
grep -n 'goo*d' regular_express.txt

在扩展正则表达式中,则可以进一步细分为一个或一个以上零个或一个字符:

+ 表示重复一个或一个以上的前一个字符
bash 复制代码
egrep -n 'go+d' regular_express.txt
? 表示重复零个或一个的前一个字符
bash 复制代码
egrep -n 'go?d' regular_express.txt

执行上述三条指令,比较三者的不同。

扩展规则(二)

| 表示用或(or)的方式找出数个字符串

查找 gd 或 good:

bash 复制代码
egrep -n 'gd|good' regular_express.txt
() 表示找出组字符串

查找 glad 或 good,注意到由于二者存在重复字母,所以可以将其合并:

bash 复制代码
egrep -n 'g(la|oo)d' regular_express.txt
()+ 多个重复群组判别

查找开头是 A 结尾是 C 中间有一个以上的 xyzxz 字符串:

bash 复制代码
echo 'AxyzxyzxyzxyzC'|egrep 'A(xyz)+C'
​
echo 'AxyzxyzxyzxyzC'|egrep 'A(xz)+C'

结果显示 A(xyz)+C 可以匹配,A(xz)+C 没有匹配项。

至此,关于正则表达式的基本知识就介绍完了,希望同学们多加练习,最终能够熟练地运用所学的关于正则表达式的知识,达到简化字符串处理的目的。

相关推荐
草莓熊Lotso1 小时前
【Linux系统加餐】从原理到封装:基于建造者模式实现System V信号量工业级C++封装
android·linux·运维·服务器·网络·c++·建造者模式
广州灵眸科技有限公司7 小时前
瑞芯微(EASY EAI)RV1126B 核心板供电电路
linux·运维·服务器·单片机·嵌入式硬件·电脑
keyipatience7 小时前
18.Linux进程退出和进程等待机制详解
linux·运维·服务器
齐齐大魔王7 小时前
Linux-网络编程实战
linux·运维·网络
花阴偷移8 小时前
Ubuntu 22.04版本下配置静态IP
linux·运维·服务器·tcp/ip·ubuntu
weixin_473437239 小时前
Swift4D处理Multi-view dataset记录
linux
霞姐聊IT11 小时前
SR-IOV、MR-IOV 与 SIOV:PCIe虚拟化技术的过去、现在与未来
linux·服务器·虚拟化·pcie
水木流年追梦11 小时前
大模型入门-Reward 奖励模型训练
开发语言·python·算法·leetcode·正则表达式
szxinmai主板定制专家11 小时前
电力设备RK3568/RK3576+FPGA,多系统混合部署Linux+RTOS RT-THREAD,强实时性
linux·运维·服务器·人工智能·嵌入式硬件·fpga开发
枕星而眠12 小时前
Linux 四大进程/线程同步锁详解:互斥锁、读写锁、条件变量、文件锁
linux·c语言·后端·ubuntu·学习方法