【C#】正则表达式

一、核心优势

用一小段规则搞定大量复杂的字符串匹配,查找和替换,并且可移植可复用。

使用正则表达式的好处:

  1. 强大且灵活:可以一次性匹配非常复杂的规则,比如验证邮箱、提取特定的格式日志、解析URL;

  2. 跨语言:

支持的语言:Python、JavaScript、C#、Java、 PHP、Lua;

支持的工具:grep、sed、Notepad++、VSCode;

  1. 减少代码量:

进行复杂的字符串处理时,可能需要几十行代码,正则表达式几行就能搞定;

  1. 灵活替换与批量处理:

能批量替换符合模式的文本,无需逐个字符串对比;结合分组引用,可以保留和重用匹配部分;

  1. 可读性与可维护性:

具有高度的可读性和可维护性,避免重复造轮子。

二、适用场景:

|---------------|-----------------------------|
| 场景 | 示例 |
| 数据验证 | 检查邮箱、手机号、身份证号码、IP地址、URL是否合法 |
| 数据提取 | 从JSON、HTML、日志中找到特定字段 |
| 批量替换 | 替换文本文件中的格式 |
| 日志分析 | 解析nginx/apache日志提取访问IP、请求时间 |
| 爬虫分析 | 对爬虫的数据进行分析 |
| IDE/文本编辑器查找替换 | 实现大量重复代码的查找和替换 |

正则特别合适的场景是有明确模式的文本处理,可以大量减少代码量,提高效率。

三、正则表达式具体内容

1.基础匹配

|--------|--------------|-----------|----------------------|
| 符号 | 功能 | 示例 | 匹配内容 |
| abc | 精确匹配 | cat | 仅匹配"cat" |
| . | 任意单个字符 | c.t | "cat","cut",但不匹配"ct" |
| [] | 匹配方括号中任意一个字符 | [abc] | "a","b","c" |
| [^] | 匹配不在方括号内字符 | [^0-9] | 非数字字符 |

  1. 预定义字符类

|-----|------------------|
| 符号 | 功能 |
| \d | 数字,等同[0-9] |
| \D | 非数字,等同[^0-9] |
| \w | 单词字符 |
| \W | 非单词字符 |
| \s | 空白字符(例如空格、制表、换行) |
| \S | 非空白字符 |

  1. 量词

|-------|-----------------------------------|
| 符号 | 功能 |
| * | 0次或者多次 |
| + | 一次或者多次 |
| ? | 0次或1次 |
| {n} | 恰好n次,例如a{3}->"aaa" |
| {n,} | 至少n次,例如a{2,}->"aa"/"aaa" |
| {n,m} | n到m次,例如a{2,4}->"aa"/'aaa"/"aaaa" |

  1. 边界与位置

|-----|--------------------------------------------------------------------------------------|
| 符号 | 功能 |
| ^ | 行首才匹配,例如^abc->"abc" |
| | 行尾才匹配,例如abc->"xyzabc" |
| \b | 单词边界,例如\bcat\b->可以匹配 "The cat sat on the mat." 中的 "cat" 但不匹配 "category" 中的 "cat"。 |
| \B | 非单词边界 |

  1. 分组与引用

|-------|-------------------------------------------------------------------------------------------------------------------------|
| 符号 | 功能 |
| (abc) | 分组,整体作为一个单元 例子:(go)+ 可以匹配 "go", "gogo", "gogogo" 等。 捕获例子:(\d{4})-(\d{2})-(\d{2}) 可以匹配日期 "2025-08-12",并分别捕获年份、月份和日期。 |

  1. 转义字符与特殊字符

|----|-------------------------------------------------|
| 符号 | 功能 |
| \ | 转义特殊字符,使其变为普通字符 |
| | | 用于在两个或多个模式中选择一个。 例子:cat|dog 匹配 "cat" 或 "dog"。 |

相关推荐
睡美人的小仙女12712 小时前
Threejs加载环境贴图报错Bad File Format: bad initial token
开发语言·javascript·redis
rayufo12 小时前
【工具】列出指定文件夹下所有的目录和文件
开发语言·前端·python
RANCE_atttackkk12 小时前
[Java]实现使用邮箱找回密码的功能
java·开发语言·前端·spring boot·intellij-idea·idea
缺点内向13 小时前
C#编程实战:如何为Word文档添加背景色或背景图片
开发语言·c#·自动化·word·.net
一起养小猫13 小时前
Flutter for OpenHarmony 实战:记账应用数据统计与可视化
开发语言·jvm·数据库·flutter·信息可视化·harmonyos
zhougl99613 小时前
Java 所有关键字及规范分类
java·开发语言
java1234_小锋13 小时前
Java高频面试题:MyISAM索引与InnoDB索引的区别?
java·开发语言
2501_9445255413 小时前
Flutter for OpenHarmony 个人理财管理App实战 - 支出分析页面
android·开发语言·前端·javascript·flutter
qq_4171292514 小时前
C++中的桥接模式变体
开发语言·c++·算法
开源技术14 小时前
如何将本地LLM模型与Ollama和Python集成
开发语言·python