正则表达式与文本处理器

文本处理器三剑客:grep(查找) sed awk

**正则表达式:**由一类特殊字符以及文本字符所编写的一种模式,处理文本当中的内容

其中的一些字符不表示字符的字面含义,这些字符表示控制或者通配的功能

**通配符:**匹配文件名和目录名,不能匹配文件内容

正则表达式有两种匹配结果:命令结果和文件内容都可以进行匹配

通配符:

*:匹配任意一个或多个字符 例:ls *.txt

?:匹配任意一个字符 例:ls ?,txt

\] :匹配范围内的任意单个字符 例:touch {a..z}.txt ls \[a-b\].txt 正则表达式:有两种形态 1、基本正则表达式 2、拓展正则表达式 两者仅限于写法上的区别,其他一样 基本正则:字符匹配,元字符,匹配的部分需要用引号引起来 **.** :表示匹配任意的单个字符,可以是一个汉字 例:ls \| grep "12**.**" **\\** :表示转义符 **\\.才是表示一个点** ():表示分组的意思 **\\(\\):这时仅表示( )** \[ \]:匹配已指定范围内的任意单个字符 例:\[0-9\] \[A-Z\] \[a-z\] ls \| grep "\[0-9\]" 显示所有:ls \| grep "\[0-9 a-z A-Z\]" 标准写法 \[ \^ \]:表示取反,指定范围外的 例:ls \| grep "\[A-Z0-9**.** \]" **.**也算字符 例:以rc开头,任意单个字符,0-6的数字 ![](https://file.jishuzhan.net/article/1683382223404797954/5348e1123ffa4abc918b54e6eda581f1.png) 只匹配以rc.为开头的文件 ![](https://file.jishuzhan.net/article/1683382223404797954/752e0eead85841438a710863c5abbde8.png) 过滤/etc/passwd中任意的两个字符r和t ![](https://file.jishuzhan.net/article/1683382223404797954/a143826e53624ade9a3423a56db2cbf4.png) 总结:通配符不能完全匹配大小写,真正的大小写在正则表达式中 表示匹配不是a或者z的任意字符 正则表达式中表示次数的表达式: **\*:匹配前面的字符任意次,0次也行,无数次也行,有多少匹配多少,没有也行** ![](https://file.jishuzhan.net/article/1683382223404797954/c2148c2523784f17b104002720573e29.png) **.\*:也是匹配任意长度的字符,但是至少要有一次,不包括0次** ![](https://file.jishuzhan.net/article/1683382223404797954/8eafd6f4f9d748bf9e7341a985c67b78.png) 最少前面要有一个o,否则不匹配 **\\?:表示匹配前面的字符0次或者1次(即可有可无)** ![](https://file.jishuzhan.net/article/1683382223404797954/44f20e0541894dd5b985f3c177753a25.png) 有则匹配,没有也匹配 **\\+:匹配前面的字符至少一次,最多可以无数次** **\\{n\\}:匹配前面的字符=n次 精确匹配 n:表示前面字符出现的次数,多一次少一次都不行、、** ![](https://file.jishuzhan.net/article/1683382223404797954/f205006245c245ac9c3e78993c390964.png) **\\{m,n\\}:匹配前面的字符最少m次,最多n次** ![](https://file.jishuzhan.net/article/1683382223404797954/6744bc4f177f43f78e8188333d83b1bb.png) **\\{,n\\}:匹配前面的字符最多n次 大于n不行 o最少出现n次** **\\{n,\\}:匹配前面的字符至少n次 小于n不行** 匹配次数就是核心 **位置锚定:**以什么为开头,以什么为结尾 \^:以什么为开头,在模式的左侧 \^r 以r为开头 $:以什么最为结尾,在模式的右侧 r$ 以r为结尾 \^ root $:用于匹配整行,而且整行中只有一个root,多一个少一个都不行 \^$:匹配空行 ![](https://file.jishuzhan.net/article/1683382223404797954/d47dc3afd472411ebddc502c7ae7f4e9.png)![](https://file.jishuzhan.net/article/1683382223404797954/de9b6722574745aabc23e7692640c5c0.png) 词首锚定和词尾锚定(用的较少) 词尾铆钉:\<或者 \\b 推荐用\\b因为更直观,用\\b的位置来判断词首和词尾 词首锚定:\>或者 \\b 例:![](https://file.jishuzhan.net/article/1683382223404797954/9449f9050fc3460d96440b5cb7c2587d.png) 分组:用**()**进行表示 精确匹配**\\{\\} 一定要连续出现 \\{,3\\} 就不用连续出现** **\\{n\\} 表示正好n次,n次表示前面的字符必须连续出现才能出现** **\\{,n\\} 只要出现几次都算,除非没有** 例: ![](https://file.jishuzhan.net/article/1683382223404797954/82b5d1c32f2942bd8cde276504981184.png) ![](https://file.jishuzhan.net/article/1683382223404797954/da16aeb8fd6d47e9b79a922ede2316d8.png) 只匹配gogle ![](https://file.jishuzhan.net/article/1683382223404797954/b26a80fc227648bd8c835c5d91bbe95d.png) \\ \|:表示逻辑或 ![](https://file.jishuzhan.net/article/1683382223404797954/e2147d84569d4681b8a76e4ec2ff6a8d.png) 扩展正则:就是把**\\**去掉不用再写,但是也有要求 grep 要写成 grep -E 或 egrep ![](https://file.jishuzhan.net/article/1683382223404797954/60fff490591d436fbb8f0118dc06380d.png)

相关推荐
1***y1789 小时前
DevOps在云中的Rancher
运维·rancher·devops
无垠的广袤10 小时前
【工业树莓派 CM0 NANO 单板计算机】本地部署 EMQX
linux·python·嵌入式硬件·物联网·树莓派·emqx·工业物联网
414a10 小时前
LingJing(灵境):Linux Amd64局域网设备访问靶机教程
linux·安全·web安全·网络安全·lingjing·灵境
tianyuanwo10 小时前
多平台容器化RPM构建流水线全指南:Fedora、CentOS与Anolis OS
linux·运维·容器·centos·rpm
BD_Marathon10 小时前
【Zookeeper】CAP理论——CAP介绍
linux·分布式·zookeeper
wasp52011 小时前
做了技术管理后,我发现技术和管理其实可以兼得
java·运维·网络
云和数据.ChenGuang11 小时前
mysqld.service is not a native service问题解决!
运维·nginx·运维技术·运维工程师技术
赖small强11 小时前
【Linux 网络基础】HTTPS 技术文档
linux·网络·https·tls
写代码的学渣11 小时前
ubuntu 22.04 新装的系统 xshell 连不上
linux·运维·ubuntu
2501_9418059312 小时前
深入解析现代多语言后端架构设计:Python、Java、C++与Go在高性能服务中的实践
运维