【C#】正则表达式

一、核心优势

用一小段规则搞定大量复杂的字符串匹配,查找和替换,并且可移植可复用。

使用正则表达式的好处:

  1. 强大且灵活:可以一次性匹配非常复杂的规则,比如验证邮箱、提取特定的格式日志、解析URL;

  2. 跨语言:

支持的语言:Python、JavaScript、C#、Java、 PHP、Lua;

支持的工具:grep、sed、Notepad++、VSCode;

  1. 减少代码量:

进行复杂的字符串处理时,可能需要几十行代码,正则表达式几行就能搞定;

  1. 灵活替换与批量处理:

能批量替换符合模式的文本,无需逐个字符串对比;结合分组引用,可以保留和重用匹配部分;

  1. 可读性与可维护性:

具有高度的可读性和可维护性,避免重复造轮子。

二、适用场景:

|---------------|-----------------------------|
| 场景 | 示例 |
| 数据验证 | 检查邮箱、手机号、身份证号码、IP地址、URL是否合法 |
| 数据提取 | 从JSON、HTML、日志中找到特定字段 |
| 批量替换 | 替换文本文件中的格式 |
| 日志分析 | 解析nginx/apache日志提取访问IP、请求时间 |
| 爬虫分析 | 对爬虫的数据进行分析 |
| IDE/文本编辑器查找替换 | 实现大量重复代码的查找和替换 |

正则特别合适的场景是有明确模式的文本处理,可以大量减少代码量,提高效率。

三、正则表达式具体内容

1.基础匹配

|--------|--------------|-----------|----------------------|
| 符号 | 功能 | 示例 | 匹配内容 |
| abc | 精确匹配 | cat | 仅匹配"cat" |
| . | 任意单个字符 | c.t | "cat","cut",但不匹配"ct" |
| [] | 匹配方括号中任意一个字符 | [abc] | "a","b","c" |
| [^] | 匹配不在方括号内字符 | [^0-9] | 非数字字符 |

  1. 预定义字符类

|-----|------------------|
| 符号 | 功能 |
| \d | 数字,等同[0-9] |
| \D | 非数字,等同[^0-9] |
| \w | 单词字符 |
| \W | 非单词字符 |
| \s | 空白字符(例如空格、制表、换行) |
| \S | 非空白字符 |

  1. 量词

|-------|-----------------------------------|
| 符号 | 功能 |
| * | 0次或者多次 |
| + | 一次或者多次 |
| ? | 0次或1次 |
| {n} | 恰好n次,例如a{3}->"aaa" |
| {n,} | 至少n次,例如a{2,}->"aa"/"aaa" |
| {n,m} | n到m次,例如a{2,4}->"aa"/'aaa"/"aaaa" |

  1. 边界与位置

|-----|--------------------------------------------------------------------------------------|
| 符号 | 功能 |
| ^ | 行首才匹配,例如^abc->"abc" |
| | 行尾才匹配,例如abc->"xyzabc" |
| \b | 单词边界,例如\bcat\b->可以匹配 "The cat sat on the mat." 中的 "cat" 但不匹配 "category" 中的 "cat"。 |
| \B | 非单词边界 |

  1. 分组与引用

|-------|-------------------------------------------------------------------------------------------------------------------------|
| 符号 | 功能 |
| (abc) | 分组,整体作为一个单元 例子:(go)+ 可以匹配 "go", "gogo", "gogogo" 等。 捕获例子:(\d{4})-(\d{2})-(\d{2}) 可以匹配日期 "2025-08-12",并分别捕获年份、月份和日期。 |

  1. 转义字符与特殊字符

|----|-------------------------------------------------|
| 符号 | 功能 |
| \ | 转义特殊字符,使其变为普通字符 |
| | | 用于在两个或多个模式中选择一个。 例子:cat|dog 匹配 "cat" 或 "dog"。 |

相关推荐
摇滚侠1 天前
@Autowired 和 @Resource 的区别
java·开发语言
Wy_编程1 天前
go语言中的结构体
开发语言·后端·golang
SeaTunnel1 天前
(八)收官篇 | 数据平台最后一公里:数据集成开发设计与上线治理实战
java·大数据·开发语言·白鲸开源
大卡片1 天前
C++的基础知识点
开发语言·c++
郑同学的笔记1 天前
【Qt教程29】Qt5和Qt6版本对比
开发语言·qt
基德爆肝c语言1 天前
Qt 主窗口全家桶:菜单栏、工具栏、状态栏与对话框完全指南
开发语言·qt
XMYX-01 天前
28 - Go JSON 数据操作
开发语言·golang·json
三*一1 天前
Mapbox GL JS 自研面要素整形工具开发实录
开发语言·javascript·arcgis·ecmascript
超级小星星1 天前
C 语言结构体内存对齐深度解析:从概念到实战
c语言·开发语言
狮子座明仔1 天前
AgentSPEX:当 Agent 框架开始把“控制流“从 Python 里抠出来
开发语言·python