第4.1节:使用正则表达式

1 第4.1节:使用正则表达式

将正则表达式用斜杠括起来,就能用作模式。随后,该正则表达式会与每条输入记录的完整文本进行比对。(通常情况下,它只需匹配文本的部分内容就能视作匹配成功。)例如,以下代码会打印出mail-list文件中,任意位置出现字符串li的记录的第二个字段:

bash 复制代码
$ awk '/li/ { print $2 }' mail-list

执行结果:

bash 复制代码
555-5553
555-0542
555-6699
555-3430

正则表达式也能用于匹配表达式中。这些表达式允许你指定要匹配的字符串,该字符串不必是当前输入记录的全部内容。~!~这两个操作符用于执行正则表达式的比较操作。使用这些操作符的表达式,既可以用作模式,也能在ifwhilefordo语句中使用(详见第7.4节 "动作中的控制语句")。例如,对于以下表达式,如果exp(作为字符串看待)与regexp匹配,则表达式的值为真:

bash 复制代码
exp ~ /regexp/

下面的示例会匹配(筛选出)所有第一个字段中含有大写字母J的输入记录:

bash 复制代码
$ awk '$1 ~ /J/' inventory-shipped

执行结果:

bash 复制代码
Jan 13 25 15 115
Jun 31 42 75 492
Jul 24 34 67 436
Jan 21 36 64 620

下面这段代码也能实现相同的功能:

bash 复制代码
awk '{ if ($1 ~ /J/) print }' inventory-shipped

再看下面这个例子,如果exp(作为字符串看待)与regexp不匹配,那么表达式的值为真:

bash 复制代码
exp !~ /regexp/

下面的示例会匹配(筛选出)所有第一个字段中不包含大写字母J的输入记录:

bash 复制代码
$ awk '$1 !~ /J/' inventory-shipped

执行结果:

bash 复制代码
Feb 15 32 24 226
Mar 15 24 34 228
Apr 31 52 63 420
May 16 34 29 208

当一个正则表达式被包含在斜杠中,如/foo/,我们称其为正则表达式常量,这与5.27是数值常量、"foo"是字符串常量的概念类似。


作者声明:本文用于记录和分享作者的学习心得,可能有部分文字或示例来自AI平台,如:豆包、DeepSeek(硅基流动) (注册链接)等,由于本人水平有限,难免存在表达错误,欢迎留言交流和指教!

Copyright © 2022~2025 All rights reserved.

相关推荐
superman超哥8 小时前
Serde 性能优化的终极武器
开发语言·rust·编程语言·rust serde·serde性能优化·rust开发工具
superman超哥6 天前
Serde 的零成本抽象设计:深入理解 Rust 序列化框架的哲学
开发语言·rust·开发工具·编程语言·rust序列化
superman超哥7 天前
序列化格式的灵活切换:Serde 生态的统一抽象力量
开发语言·rust·编程语言·rust serde·序列化格式·rust序列化格式
superman超哥7 天前
派生宏(Derive Macro)的工作原理:编译时元编程的艺术
开发语言·rust·开发工具·编程语言·rust派生宏·derive macro·rust元编程
superman超哥7 天前
处理复杂数据结构:Serde 在实战中的深度应用
开发语言·rust·开发工具·编程语言·rust serde·rust数据结构
superman超哥7 天前
错误处理与验证:Serde 中的类型安全与数据完整性
开发语言·rust·编程语言·rust编程·rust错误处理与验证·rust serde
superman超哥7 天前
自定义序列化逻辑:掌控数据编码的每一个细节
开发语言·rust·编程语言·rust自定义序列化·rust数据编码
superman超哥7 天前
Serialize 与 Deserialize Trait:Rust 类型系统与序列化的完美融合
开发语言·rust·开发工具·编程语言·rust序列化·rust类型·serialize
superman超哥7 天前
Actix-web 性能优化技巧:从原理到实践
开发语言·rust·编程语言·actix-web
superman超哥7 天前
Rust 与数据库连接池的集成:从理论到生产实践
开发语言·rust·编程语言·rust与数据库连接池的集成