【C#】正则表达式

一、核心优势

用一小段规则搞定大量复杂的字符串匹配,查找和替换,并且可移植可复用。

使用正则表达式的好处:

  1. 强大且灵活:可以一次性匹配非常复杂的规则,比如验证邮箱、提取特定的格式日志、解析URL;

  2. 跨语言:

支持的语言:Python、JavaScript、C#、Java、 PHP、Lua;

支持的工具:grep、sed、Notepad++、VSCode;

  1. 减少代码量:

进行复杂的字符串处理时,可能需要几十行代码,正则表达式几行就能搞定;

  1. 灵活替换与批量处理:

能批量替换符合模式的文本,无需逐个字符串对比;结合分组引用,可以保留和重用匹配部分;

  1. 可读性与可维护性:

具有高度的可读性和可维护性,避免重复造轮子。

二、适用场景:

|---------------|-----------------------------|
| 场景 | 示例 |
| 数据验证 | 检查邮箱、手机号、身份证号码、IP地址、URL是否合法 |
| 数据提取 | 从JSON、HTML、日志中找到特定字段 |
| 批量替换 | 替换文本文件中的格式 |
| 日志分析 | 解析nginx/apache日志提取访问IP、请求时间 |
| 爬虫分析 | 对爬虫的数据进行分析 |
| IDE/文本编辑器查找替换 | 实现大量重复代码的查找和替换 |

正则特别合适的场景是有明确模式的文本处理,可以大量减少代码量,提高效率。

三、正则表达式具体内容

1.基础匹配

|--------|--------------|-----------|----------------------|
| 符号 | 功能 | 示例 | 匹配内容 |
| abc | 精确匹配 | cat | 仅匹配"cat" |
| . | 任意单个字符 | c.t | "cat","cut",但不匹配"ct" |
| [] | 匹配方括号中任意一个字符 | [abc] | "a","b","c" |
| [^] | 匹配不在方括号内字符 | [^0-9] | 非数字字符 |

  1. 预定义字符类

|-----|------------------|
| 符号 | 功能 |
| \d | 数字,等同[0-9] |
| \D | 非数字,等同[^0-9] |
| \w | 单词字符 |
| \W | 非单词字符 |
| \s | 空白字符(例如空格、制表、换行) |
| \S | 非空白字符 |

  1. 量词

|-------|-----------------------------------|
| 符号 | 功能 |
| * | 0次或者多次 |
| + | 一次或者多次 |
| ? | 0次或1次 |
| {n} | 恰好n次,例如a{3}->"aaa" |
| {n,} | 至少n次,例如a{2,}->"aa"/"aaa" |
| {n,m} | n到m次,例如a{2,4}->"aa"/'aaa"/"aaaa" |

  1. 边界与位置

|-----|--------------------------------------------------------------------------------------|
| 符号 | 功能 |
| ^ | 行首才匹配,例如^abc->"abc" |
| | 行尾才匹配,例如abc->"xyzabc" |
| \b | 单词边界,例如\bcat\b->可以匹配 "The cat sat on the mat." 中的 "cat" 但不匹配 "category" 中的 "cat"。 |
| \B | 非单词边界 |

  1. 分组与引用

|-------|-------------------------------------------------------------------------------------------------------------------------|
| 符号 | 功能 |
| (abc) | 分组,整体作为一个单元 例子:(go)+ 可以匹配 "go", "gogo", "gogogo" 等。 捕获例子:(\d{4})-(\d{2})-(\d{2}) 可以匹配日期 "2025-08-12",并分别捕获年份、月份和日期。 |

  1. 转义字符与特殊字符

|----|-------------------------------------------------|
| 符号 | 功能 |
| \ | 转义特殊字符,使其变为普通字符 |
| | | 用于在两个或多个模式中选择一个。 例子:cat|dog 匹配 "cat" 或 "dog"。 |

相关推荐
xiaobobo333012 分钟前
C语言中关于普通变量和指针变量、结构体包含子结构体或包含结构体指针的一些思考
c语言·开发语言·结构体指针
java1234_小锋44 分钟前
周学会Matplotlib3 Python 数据可视化-绘制折线图(Lines)
开发语言·python·信息可视化·matplotlib·折线图·matplotlib3
java1234_小锋1 小时前
一周学会Matplotlib3 Python 数据可视化-绘制直方图(Histogram)
开发语言·python·信息可视化·matplotlib·matplotlib3
拭心1 小时前
一键生成 Android 适配不同分辨率尺寸的图片
android·开发语言·javascript
悦人楼2 小时前
当C#遇上Notepad++:实现GCode可视化编辑的跨界实践
java·c#·notepad++
Kyln.Wu2 小时前
【python实用小脚本-182】Python一键爬取今日新闻:5分钟生成Word+CSV——再也不用复制粘贴
开发语言·python·word
沐知全栈开发2 小时前
《C 指针》深度解析
开发语言
猪蹄手3 小时前
C/C++基础详解(三)
开发语言·jvm·c++
别来无恙1493 小时前
Java 8 Stream API 完全指南:优雅处理集合数据
java·开发语言·streamapi