C# 字符串与正则表达式介绍


.NET学习资料

.NET学习资料

.NET学习资料


在 C# 编程中,字符串和正则表达式是处理文本数据时不可或缺的工具。深入理解它们的特性和用法,能够显著提升开发效率和代码质量。

一、C# 字符串

(一)字符串的不可变性

在 C# 中,字符串类型string是不可变的。这意味着一旦创建了一个字符串对象,其内容就无法直接更改。当对字符串进行诸如拼接、裁剪或替换等操作时,实际上会创建一个新的字符串对象,而非修改原有的对象。

这种不可变性设计基于多方面的考量:

性能优化:.NET 运行时可以对字符串进行缓存和共享。相同内容的字符串在字符串池(String Intern Pool)中可以共用内存,从而减少内存占用。例如:

csharp 复制代码
string str1 = "Hello";
string str2 = "Hello";
Console.WriteLine(object.ReferenceEquals(str1, str2)); // 输出True,表明str1和str2指向同一个内存地址

安全性:在多线程环境下,不可变的字符串是安全的。多个线程可以同时读取相同的字符串对象,而无需担心数据被意外修改。

易于调试:不可变对象减少了意外更改的风险,使得代码调试和追踪更加容易。

(二)常用字符串操作方法

查找方法

IndexOf():查找某字符或字符串在目标字符串中第一次出现的下标,索引从 0 开始。若未找到对应数据,则返回 - 1。例如:

csharp 复制代码
string text = "Hello, World!";
int index = text.IndexOf("World");
Console.WriteLine(index); // 输出7

LastIndexOf():查找某字符或字符串在目标字符串中最后一次出现的下标,若未找到则返回 - 1。例如:

csharp 复制代码
string text = "Hello, World! World";
int lastIndex = text.LastIndexOf("World");
Console.WriteLine(lastIndex); // 输出13

Contains():检测字符串中是否包含指定的数据,返回布尔值。例如:

csharp 复制代码
string text = "Hello, World!";
bool contains = text.Contains("Hello");
Console.WriteLine(contains); // 输出True
截取方法

Substring():从目标字符串中截取数据,有两种重载形式。一种是从指定位置截取到字符串末尾,另一种是从指定位置开始截取指定长度的字符。例如:

csharp 复制代码
string text = "Hello, World!";
string sub1 = text.Substring(7);
string sub2 = text.Substring(0, 5);
Console.WriteLine(sub1); // 输出World!
Console.WriteLine(sub2); // 输出Hello
分割与连接方法

Split():根据指定的字符分割字符串,返回字符串数组。例如:

csharp 复制代码
string text = "apple,banana,orange";
string[] fruits = text.Split(',');
foreach (string fruit in fruits)
{
    Console.WriteLine(fruit);
}

Join():使用指定字符串连接一些字符串,组成新的字符串。这是string的静态方法。例如:

csharp 复制代码
string[] fruits = { "apple", "banana", "orange" };
string joined = string.Join(", ", fruits);
Console.WriteLine(joined); // 输出apple, banana, orange
替换方法

Replace():使用指定字符或字符串替换目标字符串中的数据,常用于敏感词替换等场景。例如:

csharp 复制代码
string text = "Hello, World!";
string replaced = text.Replace("World", "C#");
Console.WriteLine(replaced); // 输出Hello, C#!
格式化方法

Format():用于格式化字符串,通过占位符将不同类型的数据插入到字符串中。例如:

csharp 复制代码
string name = "Alice";
int age = 30;
string message = string.Format("My name is {0}, and I'm {1} years old.", name, age);
Console.WriteLine(message); // 输出My name is Alice, and I'm 30 years old.

(三)StringBuilder 类

由于string的不可变性,在需要频繁修改字符串的场景下,会产生大量临时对象,影响性能。此时,StringBuilder类应运而生。StringBuilder是可变的,适用于高性能的字符串操作。

例如,当进行大量字符串拼接时:

csharp 复制代码
// 使用string
string result1 = "";
for (int i = 0; i < 1000; i++)
{
    result1 += i.ToString();
}

// 使用StringBuilder
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 1000; i++)
{
    sb.Append(i.ToString());
}
string result2 = sb.ToString();

可以明显看出,使用StringBuilder在性能上更具优势,因为它直接在原对象上进行修改,避免了大量临时字符串对象的创建。

二、C# 正则表达式

(一)正则表达式基础语法

正则表达式是一种用于匹配和操作文本的强大工具,它通过特定的字符模式来描述文本的特征。

字符匹配

.:匹配除换行符之外的任何单个字符。例如,模式a.c可以匹配abc、a1c等。

[字符集合]:匹配字符集合中的任意一个字符。例如,[aeiou]可以匹配任何一个元音字母。

[^字符集合]:匹配不在字符集合中的任意一个字符。例如,[^0-9]可以匹配任何非数字字符。

数量限定符

*:匹配前面的子表达式零次或多次。例如,a*可以匹配空字符串、a、aa等。

+:匹配前面的子表达式一次或多次。例如,a+可以匹配a、aa等,但不能匹配空字符串。

?:匹配前面的子表达式零次或一次。例如,a?可以匹配空字符串或a。

{n}:匹配前面的子表达式恰好n次。例如,a{3}只能匹配aaa。

{n,}:匹配前面的子表达式至少n次。例如,a{3,}可以匹配aaa、aaaa等。

{n,m}:匹配前面的子表达式至少n次,最多m次。例如,a{3,5}可以匹配aaa、aaaa、aaaaa。

边界匹配

^:匹配输入字符串的开始位置。例如,^Hello表示以Hello开头的字符串。

$:匹配输入字符串的结束位置。例如,World$表示以World结尾的字符串。

(二)常用正则表达式示例

验证数字

只能输入数字:^(0-9)*$

只能输入 n 位的数字:^\d{n}$

只能输入至少 n 位的数字:^\d{n,}$

只能输入 m~n 位的数字:^\d{m,n}$

只能输入零和非零开头的数字:^(0|(1-9)\d*)$

验证邮箱地址
csharp 复制代码
^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$
验证 URL 地址
csharp 复制代码
^http(s)?://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

(三)在 C# 中使用正则表达式

在 C# 中,使用System.Text.RegularExpressions命名空间来操作正则表达式。主要涉及的类有Regex和Match、MatchCollection。

例如,验证一个字符串是否为有效的邮箱地址:

csharp 复制代码
using System;
using System.Text.RegularExpressions;

class Program
{
    static void Main()
    {
        string email = "test@example.com";
        string pattern = @"^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$";
        bool isMatch = Regex.IsMatch(email, pattern);
        if (isMatch)
        {
            Console.WriteLine("Valid email address.");
        }
        else
        {
            Console.WriteLine("Invalid email address.");
        }
    }
}

如果需要获取匹配的具体内容,可以使用Regex.Match方法返回Match对象,或使用Regex.Matches方法返回MatchCollection对象。例如:

csharp 复制代码
string text = "The quick brown fox jumps over the lazy dog. The dog is cute.";
string pattern = @"dog";
MatchCollection matches = Regex.Matches(text, pattern);
foreach (Match match in matches)
{
    Console.WriteLine("Match found at index {0}: {1}", match.Index, match.Value);
}

C# 字符串和正则表达式在文本处理中各有其独特的作用。字符串提供了基本的文本操作功能,而正则表达式则能实现更复杂的模式匹配和文本验证。在实际编程中,应根据具体需求灵活运用它们,以实现高效、准确的文本处理。

相关推荐
浮生如梦_2 分钟前
双目标定与生成深度图
图像处理·人工智能·计算机视觉·c#·视觉检测
大名顶顶9 分钟前
数据结构实战之线性表(三)
c语言·数据结构·c#·线性回归
呼啦啦啦啦啦啦啦啦25 分钟前
【Redis】主从模式,哨兵,集群
数据库·redis·缓存
~时泪~39 分钟前
sql主从同步
数据库·sql
予早1 小时前
SQLModel入门
数据库·orm·sqlmodel
数据的世界011 小时前
C#常用744单词
c#
幻想趾于现实1 小时前
C#中的委托(Delegate)
开发语言·c#
ThinkStu1 小时前
2025年时序数据库发展方向和前景分析
数据库·时序数据库
Uncommon.2 小时前
MySQL-索引下推
数据库·mysql
天乐敲代码2 小时前
java-(Oracle)-Oracle,plsqldev,Sql语法,Oracle函数
数据库·oracle