【C#】正则表达式

一、核心优势

用一小段规则搞定大量复杂的字符串匹配,查找和替换,并且可移植可复用。

使用正则表达式的好处:

  1. 强大且灵活:可以一次性匹配非常复杂的规则,比如验证邮箱、提取特定的格式日志、解析URL;

  2. 跨语言:

支持的语言:Python、JavaScript、C#、Java、 PHP、Lua;

支持的工具:grep、sed、Notepad++、VSCode;

  1. 减少代码量:

进行复杂的字符串处理时,可能需要几十行代码,正则表达式几行就能搞定;

  1. 灵活替换与批量处理:

能批量替换符合模式的文本,无需逐个字符串对比;结合分组引用,可以保留和重用匹配部分;

  1. 可读性与可维护性:

具有高度的可读性和可维护性,避免重复造轮子。

二、适用场景:

|---------------|-----------------------------|
| 场景 | 示例 |
| 数据验证 | 检查邮箱、手机号、身份证号码、IP地址、URL是否合法 |
| 数据提取 | 从JSON、HTML、日志中找到特定字段 |
| 批量替换 | 替换文本文件中的格式 |
| 日志分析 | 解析nginx/apache日志提取访问IP、请求时间 |
| 爬虫分析 | 对爬虫的数据进行分析 |
| IDE/文本编辑器查找替换 | 实现大量重复代码的查找和替换 |

正则特别合适的场景是有明确模式的文本处理,可以大量减少代码量,提高效率。

三、正则表达式具体内容

1.基础匹配

|--------|--------------|-----------|----------------------|
| 符号 | 功能 | 示例 | 匹配内容 |
| abc | 精确匹配 | cat | 仅匹配"cat" |
| . | 任意单个字符 | c.t | "cat","cut",但不匹配"ct" |
| [] | 匹配方括号中任意一个字符 | [abc] | "a","b","c" |
| [^] | 匹配不在方括号内字符 | [^0-9] | 非数字字符 |

  1. 预定义字符类

|-----|------------------|
| 符号 | 功能 |
| \d | 数字,等同[0-9] |
| \D | 非数字,等同[^0-9] |
| \w | 单词字符 |
| \W | 非单词字符 |
| \s | 空白字符(例如空格、制表、换行) |
| \S | 非空白字符 |

  1. 量词

|-------|-----------------------------------|
| 符号 | 功能 |
| * | 0次或者多次 |
| + | 一次或者多次 |
| ? | 0次或1次 |
| {n} | 恰好n次,例如a{3}->"aaa" |
| {n,} | 至少n次,例如a{2,}->"aa"/"aaa" |
| {n,m} | n到m次,例如a{2,4}->"aa"/'aaa"/"aaaa" |

  1. 边界与位置

|-----|--------------------------------------------------------------------------------------|
| 符号 | 功能 |
| ^ | 行首才匹配,例如^abc->"abc" |
| | 行尾才匹配,例如abc->"xyzabc" |
| \b | 单词边界,例如\bcat\b->可以匹配 "The cat sat on the mat." 中的 "cat" 但不匹配 "category" 中的 "cat"。 |
| \B | 非单词边界 |

  1. 分组与引用

|-------|-------------------------------------------------------------------------------------------------------------------------|
| 符号 | 功能 |
| (abc) | 分组,整体作为一个单元 例子:(go)+ 可以匹配 "go", "gogo", "gogogo" 等。 捕获例子:(\d{4})-(\d{2})-(\d{2}) 可以匹配日期 "2025-08-12",并分别捕获年份、月份和日期。 |

  1. 转义字符与特殊字符

|----|-------------------------------------------------|
| 符号 | 功能 |
| \ | 转义特殊字符,使其变为普通字符 |
| | | 用于在两个或多个模式中选择一个。 例子:cat|dog 匹配 "cat" 或 "dog"。 |

相关推荐
NRatel7 分钟前
Unity项目基本风格/规范
unity·c#·游戏引擎·代码规范·规范
潼心1412o16 分钟前
C语言(长期更新)第12讲:指针二详解
c语言·开发语言
荼蘼22 分钟前
Python 爬虫实战:爬取 B 站视频的完整教程
开发语言·爬虫·python
小菜全1 小时前
使用Java获取本地PDF文件并解析数据
java·开发语言·python
chinesegf2 小时前
浏览器内存 (JavaScript运行时内存)存储的优劣分析
开发语言·javascript·ecmascript
yangchanghua1112 小时前
Caused by: java.net.SocketTimeoutException: Read timed out;
java·开发语言·spring
无边风月-风之羽翼2 小时前
【自记录】Ubuntu20.04下Python自编译
开发语言·python
菜鸟康2 小时前
手写Muduo网络库核心代码2--Poller、EPollPoller详细讲解
开发语言·网络·php
秋风&萧瑟2 小时前
【QT】Qt QSS 中 background-image、image 和 border-image 的区别
开发语言·qt
学生董格2 小时前
[嵌入式embed][Qt]Qt5.12+Opencv4.x+Cmake4.x_测试Qt编译的opencv4.x的库
开发语言·qt