C# 正则表达式(3):分组与捕获——从子串提取到命名分组

一、分组是什么:让一段模式成为"一个单元"

1. 普通分组:(...)

分组最直接的作用是"打包",使用()完成打包,一个括号就是一个分组。例如你想匹配 ab 重复多次:

  • 错误:ab+ 只会让 b 重复
  • 正确:(ab)+ab 作为整体重复

2. 分组 + 量词:控制重复结构

示例:匹配 2025-12-18 这种日期结构

regex 复制代码
(\d{4})-(\d{2})-(\d{2})

解析:

  • 这里有 3 个分组:年、月、日。它们不仅能帮助你"读懂结构",更重要的是能在代码里提取出来。

二、捕获组:Match.Groups 到底是什么?

示例:

csharp 复制代码
using System;
using System.Text.RegularExpressions;

var input = "2025-12-18";
var pattern = @"^(\d{4})-(\d{2})-(\d{2})$";

Match match = Regex.Match(input, pattern);
if (!match.Success)
{
    Console.WriteLine("No match");
    return;
}

Console.WriteLine($"Full: {match.Groups[0].Value}");
Console.WriteLine($"Year: {match.Groups[1].Value}");
Console.WriteLine($"Month:{match.Groups[2].Value}");
Console.WriteLine($"Day:  {match.Groups[3].Value}");

解析:

  • Groups[0] 永远是"整个匹配到的字符串"
  • Groups[1] 开始才是你写的第 1、2、3... 个捕获组

三、命名分组:让提取更稳、更好维护

当分组多了以后,Groups[7] 这种写法非常容易错。命名分组就是解决这个问题的。

语法:

regex 复制代码
(?<name>...)

把上面的日期改成命名分组:

csharp 复制代码
var input = "2025-12-18";
var input = "2025-12-18";
var pattern = @"^(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})$";

Match match = Regex.Match(input, pattern);
Console.WriteLine(match.Groups["year"].Value);  // 2025
Console.WriteLine(match.Groups["month"].Value); // 12
Console.WriteLine(match.Groups["day"].Value);   // 18

// 依然可以用序号访问到目标内容
Console.WriteLine($"Full: {match.Groups[0].Value}");
Console.WriteLine($"Year: {match.Groups[1].Value}");
Console.WriteLine($"Month:{match.Groups[2].Value}");
Console.WriteLine($"Day:  {match.Groups[3].Value}");

四、Regex.Replace 的"重排": <math xmlns="http://www.w3.org/1998/Math/MathML"> 1 与 1 与 </math>1与{name}

1. 按序号引用:$1$2...

序号从1开始

csharp 复制代码
var input = "2025-12-18";
var pattern = @"^(\d{4})-(\d{2})-(\d{2})$";

var output = Regex.Replace(input, pattern, "$3/$2/$1");
Console.WriteLine(output); // 18/12/2025

2. 按名称引用:${year}${month}...

csharp 复制代码
var input = "2025-12-18";
var pattern = @"^(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})$";

var output = Regex.Replace(input, pattern, "${day}/${month}/${year}");
Console.WriteLine(output); // 18/12/2025

五、非捕获分组:(?:...)

当我们想匹配整体,并且分组内容不存入 Groups 集合。此时用非捕获分组:

regex 复制代码
(?:...)

示例:

csharp 复制代码
string input = "I love C# and I love Java";

// 使用非捕获分组 (?:C#|Java)
// 它只是为了让 | (或) 逻辑生效,而不建立单独的提取组
string pattern = @"I love (?:C#|Java)";

MatchCollection matches = Regex.Matches(input, pattern);

foreach (Match m in matches)
{
    Console.WriteLine($"完全匹配内容: {m.Value}");
    Console.WriteLine($"分组数量: {m.Groups.Count}"); // 索引 0 永远是完整匹配,并且只有一个,没有为C#|Java单独分组
}
/*输出
完全匹配内容: I love C#
分组数量: 1
完全匹配内容: I love Java
分组数量: 1
*/

结语

点个赞,关注我获取更多实用 C# 技术干货!如果觉得有用,记得收藏本文

相关推荐
eason_fan3 小时前
从一则内存快照看iframe泄漏:活跃与Detached状态的回收差异
前端·性能优化
狗头大军之江苏分军3 小时前
年底科技大考:2025 中国前端工程师的 AI 辅助工具实战盘点
java·前端·后端
编程修仙4 小时前
第三篇 Vue路由
前端·javascript·vue.js
比老马还六4 小时前
Bipes项目二次开发/硬件编程-设备连接(七)
前端·javascript
掘金一周4 小时前
前端一行代码生成数千页PDF,dompdf.js新增分页功能| 掘金一周 12.25
前端·javascript·后端
张就是我1065924 小时前
漏洞复现指南:利用 phpinfo() 绕过 HttpOnly Cookie 保护
前端
Kagol4 小时前
🎉TinyVue v3.27.0 正式发布:增加 Space 新组件,ColorPicker 组件支持线性渐变
前端·vue.js·typescript
潍坊老登4 小时前
大前端框架汇总/产品交互参考UE
前端
方安乐5 小时前
获取URL参数如何避免XSS攻击
前端·xss