一.基本功能介绍:
在Qt中,可以使用QRegularExpression类来处理正则表达式。以下是一些常用的正则表达式用法:
1.创建正则表达式对象:
cpp
QRegularExpression regex("pattern");
2.匹配字符串:
cpp
QString str = "Hello, World!";
if (regex.match(str).hasMatch()) {
qDebug() << "Match found!";
} else {
qDebug() << "No match found!";
}
3.捕获匹配的内容:
cpp
QRegularExpressionMatch match = regex.match(str);
if (match.hasMatch()) {
qDebug() << "Captured text: " << match.captured();
}
4.替换匹配的内容:
cpp
QString replacedStr = regex.replace(str, "replacement");
5.检测是否匹配:
cpp
if (regex.isValid()) {
qDebug() << "Valid regex pattern!";
} else {
qDebug() << "Invalid regex pattern!";
}
6.使用捕获组:
cpp
QRegularExpression regex("(\\d+):(\\w+)");
QString str = "123:abc";
QRegularExpressionMatch match = regex.match(str);
if (match.hasMatch()) {
qDebug() << "Number: " << match.captured(1);
qDebug() << "Text: " << match.captured(2);
}
二.写法介绍
2.1:匹配的示例
当使用正则表达式时,可以根据具体的需求和匹配规则来编写不同的正则表达式模式。以下是一些常见的正则表达式写法示例:
匹配数字:\d+
- 示例:匹配一个或多个数字,例如:"123", "4567"等。
匹配字母:[a-zA-Z]+
- 示例:匹配一个或多个字母,不区分大小写,例如:"abc", "XYZ"等。
匹配邮箱地址:\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+.[A-Z|a-z]{2,}\b
- 示例:匹配常见的邮箱地址格式,例如:"example@example.com", "test123@test.com"等。
匹配URL:(http|https)://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?
- 示例:匹配常见的URL格式,例如:"http://www.example.com", "https://www.test.com/page1"等。
匹配手机号码:1\d{10}
- 示例:匹配中国大陆手机号码格式,以1开头,共11位数字,例如:"13912345678", "18888888888"等。
2.2:相关符号介绍
在正则表达式中,*、?、+、{n} 等符号被称为量词,用于指定匹配模式中前面字符的重复次数或出现情况。下面详细介绍一些常用的量词及其作用:
*(星号):表示匹配前面的字符零次或多次。
- 示例:ab* 可以匹配 "a", "ab", "abb", "abbb" 等。
+(加号):表示匹配前面的字符至少一次或多次。
- 示例:ab+ 可以匹配 "ab", "abb", "abbb" 等,但不能匹配 "a"。
?(问号):表示匹配前面的字符零次或一次,即可选匹配。
- 示例:ab? 可以匹配 "a", "ab",但不能匹配 "abb"。
{n}:表示匹配前面的字符恰好 n 次。
- 示例:a{3} 可以匹配 "aaa",但不能匹配 "aa" 或 "aaaa"。
{n,}:表示匹配前面的字符至少 n 次。
- 示例:a{2,} 可以匹配 "aa", "aaa", "aaaa" 等。
{n,m}:表示匹配前面的字符至少 n 次,最多 m 次。
- 示例:a{2,4} 可以匹配 "aa", "aaa", "aaaa",但不能匹配 "a" 或 "aaaaa"。
这些量词可以用于控制匹配模式中字符重复次数的范围,使得正则表达式更加灵活和精确。在实际应用中,根据具体的匹配需求和规则,可以灵活运用这些量词来构建符合要求的正则表达式模式。
三.复杂样例分析
对^[a-zA-Z][\\w]{5,17}@([A-Za-z0-9\\-]+\\.)+[A-Za-z]{2,6}$进行分析
这个表达式是用来匹配电子邮件地址的。解读如下:
- ^ 表示匹配输入字符串的开始位置
- [a-zA-Z] 表示第一个字符必须是字母,不区分大小写
- [\w]{5,17} 表示后面的字符可以是字母、数字或下划线,且长度在5到17之间
- @ 表示匹配@符号
- ([A-Za-Z0-9]+\\.)+ 表示匹配域名部分,可以包含字母、数字和短横线,且必须以点号结尾,且可以重复多次
- [A-Za-z]{2,6} 表示匹配顶级域名,可以是2到6个字母
- $ 表示匹配输入字符串的结尾位置
因此,这个表达式可以匹配形如"example123@example.com"的电子邮件地址。