一、核心优势:
用一小段规则搞定大量复杂的字符串匹配,查找和替换,并且可移植可复用。
使用正则表达式的好处:
强大且灵活:可以一次性匹配非常复杂的规则,比如验证邮箱、提取特定的格式日志、解析URL;
跨语言:
支持的语言:Python、JavaScript、C#、Java、 PHP、Lua;
支持的工具:grep、sed、Notepad++、VSCode;
- 减少代码量:
进行复杂的字符串处理时,可能需要几十行代码,正则表达式几行就能搞定;
- 灵活替换与批量处理:
能批量替换符合模式的文本,无需逐个字符串对比;结合分组引用,可以保留和重用匹配部分;
- 可读性与可维护性:
具有高度的可读性和可维护性,避免重复造轮子。
二、适用场景:
|---------------|-----------------------------|
| 场景 | 示例 |
| 数据验证 | 检查邮箱、手机号、身份证号码、IP地址、URL是否合法 |
| 数据提取 | 从JSON、HTML、日志中找到特定字段 |
| 批量替换 | 替换文本文件中的格式 |
| 日志分析 | 解析nginx/apache日志提取访问IP、请求时间 |
| 爬虫分析 | 对爬虫的数据进行分析 |
| IDE/文本编辑器查找替换 | 实现大量重复代码的查找和替换 |正则特别合适的场景是有明确模式的文本处理,可以大量减少代码量,提高效率。
三、正则表达式具体内容
1.基础匹配
|--------|--------------|-----------|----------------------|
| 符号 | 功能 | 示例 | 匹配内容 |
| abc | 精确匹配 | cat | 仅匹配"cat" |
| . | 任意单个字符 | c.t | "cat","cut",但不匹配"ct" |
| [] | 匹配方括号中任意一个字符 | [abc] | "a","b","c" |
| [^] | 匹配不在方括号内字符 | [^0-9] | 非数字字符 |
- 预定义字符类
|-----|------------------|
| 符号 | 功能 |
| \d | 数字,等同[0-9] |
| \D | 非数字,等同[^0-9] |
| \w | 单词字符 |
| \W | 非单词字符 |
| \s | 空白字符(例如空格、制表、换行) |
| \S | 非空白字符 |
- 量词
|-------|-----------------------------------|
| 符号 | 功能 |
| * | 0次或者多次 |
| + | 一次或者多次 |
| ? | 0次或1次 |
| {n} | 恰好n次,例如a{3}->"aaa" |
| {n,} | 至少n次,例如a{2,}->"aa"/"aaa" |
| {n,m} | n到m次,例如a{2,4}->"aa"/'aaa"/"aaaa" |
- 边界与位置
|-----|--------------------------------------------------------------------------------------|
| 符号 | 功能 |
| ^ | 行首才匹配,例如^abc->"abc" |
| | 行尾才匹配,例如abc->"xyzabc" |
| \b | 单词边界,例如\bcat\b->可以匹配 "The cat sat on the mat." 中的 "cat" 但不匹配 "category" 中的 "cat"。 |
| \B | 非单词边界 |
- 分组与引用
|-------|-------------------------------------------------------------------------------------------------------------------------|
| 符号 | 功能 |
| (abc) | 分组,整体作为一个单元 例子:(go)+
可以匹配 "go", "gogo", "gogogo" 等。 捕获例子:(\d{4})-(\d{2})-(\d{2})
可以匹配日期 "2025-08-12",并分别捕获年份、月份和日期。 |
- 转义字符与特殊字符
|----|-------------------------------------------------|
| 符号 | 功能 |
| \ | 转义特殊字符,使其变为普通字符 |
| | | 用于在两个或多个模式中选择一个。 例子:cat|dog
匹配 "cat" 或 "dog"。 |
【C#】正则表达式
大飞pkz2025-08-13 15:57
相关推荐
NRatel7 分钟前
Unity项目基本风格/规范潼心1412o16 分钟前
C语言(长期更新)第12讲:指针二详解荼蘼22 分钟前
Python 爬虫实战:爬取 B 站视频的完整教程小菜全1 小时前
使用Java获取本地PDF文件并解析数据chinesegf2 小时前
浏览器内存 (JavaScript运行时内存)存储的优劣分析yangchanghua1112 小时前
Caused by: java.net.SocketTimeoutException: Read timed out;无边风月-风之羽翼2 小时前
【自记录】Ubuntu20.04下Python自编译菜鸟康2 小时前
手写Muduo网络库核心代码2--Poller、EPollPoller详细讲解秋风&萧瑟2 小时前
【QT】Qt QSS 中 background-image、image 和 border-image 的区别学生董格2 小时前
[嵌入式embed][Qt]Qt5.12+Opencv4.x+Cmake4.x_测试Qt编译的opencv4.x的库