一文入门：正则表达式基础

书生有只狗᭄゛ঞ2024-08-22 8:27

正则表达式简介

正则表达式（Regular Expression，简称regex或RE）是一种用于匹配字符串中字符组合的模式。它广泛应用于编程语言、文本编辑器和各种工具中，用于执行复杂的字符串搜索和替换任务。

为什么使用正则表达式？

高效性：正则表达式可以快速地在大量文本中搜索特定的模式。
灵活性：它能够匹配复杂的字符串模式，如电子邮件地址、电话号码等。
可读性：一旦熟悉了正则表达式的语法，它通常比编程代码更易于理解和维护。

基本语法

字符类 ：[abc] 匹配任何一个括号内的字符。
预定义字符类 ：\d 匹配任意数字，相当于 [0-9]。
量词：
- * 匹配前面的元素零次或多次。
- + 匹配前面的元素一次或多次。
- ? 匹配前面的元素零次或一次。
分组：( ) 将多个元素组合成一个单元，并可以对它们应用量词。
选择：| 表示"或"，匹配两个选项中的任意一个。

进阶特性

懒惰量词 ：*?, +?, ?? 尽可能少地匹配字符。
贪婪量词 ：*, +, ? 默认情况下尽可能多地匹配字符。
断言：
- ^ 匹配字符串的开始。
- $ 匹配字符串的结束。
- \b 匹配单词的边界。
后向引用 ：使用 \1, \2 等引用前面匹配的分组。

实例演示

假设我们需要从一个文本中找出所有的电子邮件地址。电子邮件地址通常具有以下格式：username@domain.com。

bash 复制代码

\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b

这个正则表达式解释如下：

\b 表示单词边界，确保我们匹配的是完整的电子邮件地址。
[A-Za-z0-9._%+-]+ 匹配电子邮件用户名部分。
@ 字面意义上的"@"符号。
[A-Za-z0-9.-]+ 匹配域名部分。
\. 匹配点号，由于点号在正则表达式中有特殊含义，所以需要转义。
[A-Z|a-z]{2,} 匹配顶级域名，至少两个字符。

正则表达式工具

在线测试工具：如 Regex101、Regexr 等，可以实时测试正则表达式。
编程语言支持：几乎所有现代编程语言都内置了对正则表达式的支持。

结语

正则表达式是一个强大的工具，但也需要一定的学习曲线。通过不断实践和使用，你将能够掌握这一强大的文本处理技能。

上一篇：easypoi模板导出word并且合并行

下一篇：【乐吾乐大屏可视化组态编辑器】下载离线部署包

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06AI科技热点日报 | 2026年07月01日 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……