第二章 (补充)正则表达式

一、简介

Qt的QRegExp类是 正则表达式的表示类,它基于Prel的正则表达式语言,完全支持Unicode。

正则表达式(regular expression)由表达式(expressions)、量词(quantifiers)和断言(assertions)组成。

表达式(expressions):

最简单的表达式是一个字符。字符集可以使用表达式如"[AEIOU]",表示匹配所有的大写元音字母;使用"[^AEIOU]",表示匹配所有非元音字母;连续的字符集可以使用表达式"[a-z]",表示匹配所有的小写英文字母。

|---------|---------------------------------------------|
| c | 匹配字符本身,如a匹配a |
| \c | 跟在\后面的字符匹配字符本身,但本表中下面指定的这些字符除外。 |
| \a | 匹配ASCII的振铃 |
| \f | 匹配ASCII的换页 |
| \n | 匹配ASCII的换行 |
| \r | 匹配ASCII的回车 |
| \t | 匹配ASCII的水平制表符 |
| \v | 匹配ASCII的垂直制表符 |
| \xhhhh | 匹配Unicode字符对应的十六进制数 |
| \0ooo | 匹配八进制的ASCII/Latin1字符 |
| . | 匹配任意字符 |
| \d | 匹配任意一个数字 |
| \D | 匹配一个非数字 |
| \s | 匹配一个空白字符,包括"\t"、"\n"、"\v"、"\f"、"\r"及"" |
| \S | 匹配一个非空白字符 |
| \w | 匹配一个单词字符,包括任意字符数字下划线,即A~Z,a~z,0~9中任意一个 |
| \W | 匹配一个非单词字符 |
| \n | 第n个反向引用 |

量词(quantifiers):

量词说明表达式出现的次数,如"x{1,2}"表示x可以出现至少一次,至多两次。

|------------|------------------|
| 量词 | 含义 |
| E? | 匹配0次或1次等价于E{0,1} |
| E+ | 匹配1次或多次,等价于E{1,} |
| E* | 匹配0次或多次,等价于E{0,} |
| E{n} | 匹配n次 |
| E{n,} | 匹配至少n次 |
| E{,m} | 匹配至多m次 |
| E{n,m} | 匹配至少n次,至多m次 |
[正则表达式的量词]

断言(assertions):

断言在regexp中作出一些有关文本的声明,它们不匹配任何字符。

|------------|-----------------------------|
| 断言 | 含义 |
| ^ | 标志字符串的开始。若匹配"^"则使用"\\^" |
| $ | 标志字符串的结尾。若匹配""则使用"\\\\" |
| \b | 一个单词的边界 |
| \B | 一个非单词的边界。当\b为false则它为true |
| (?=E) | 表达式后紧跟E才匹配 |
| (?!E) | 表达式后不跟E才匹配 |
[断言]

通配符:

|-------------|---------------------|
| 通配符 | 含义 |
| c | 任意一个字符,表字符本身 |
| ? | 任意一个字符,类似regexp中"." |
| * | 任意0个或多个字符 |
| [...] | 在[]中的字符集 |

二、练习

cpp 复制代码
#include <QCoreApplication>
#include <QDebug>
#include <QRegularExpression>

int main(int argc, char *argv[])
{
    QCoreApplication a(argc, argv);

    QRegExp reg("ab");
    qDebug() << "匹配字符本身:"
             << reg.exactMatch("abc")
             << reg.exactMatch("ab")
             << endl;

    QRegExp reg0("(\\d*\\D{2})");
    qDebug() << "匹配数字:"
             << reg0.exactMatch("183cm")
             << reg0.exactMatch("183m")
             << reg0.exactMatch("72in");

    QRegExp rx("*.txt");
    //设置匹配语法
    rx.setPatternSyntax(QRegExp::Wildcard);//支持通配符
    qDebug() << "通配符匹配:"
             << rx.exactMatch("License.txt")
             << rx.exactMatch("License.txt.bak")
             << endl;

    //匹配单词边界
    QRegExp reg1;
    //设置匹配模式
    reg1.setPattern("\\b(hello|Hello)\\b");
    qDebug() << "匹配多个单词:"
             << reg1.indexIn("helloEveryone!")      //-1表失败
             << reg1.indexIn("Hmm hello everyone!") //4,匹配到的字符位置
             << reg1.indexIn("Hi girls! Hello boys!")//10
             << endl;

    //捕获匹配的文本
    //非捕获括号语法:由 "(?:" 开始,")"结束
    QRegExp regHeight("(\\d+)(?:\\s*)(cm|inch)");
    int res = regHeight.indexIn("YaoMing 226 cm");
    if(res > -1){
        qDebug() << "文本捕获:"
                 << "cap(0):" << regHeight.cap(0)
                 << "cap(1):" << regHeight.cap(1)
                 << "cap(2):" << regHeight.cap(2)
                 << endl;
    }

    //断言?! 不紧跟才匹配
    QRegExp reg2;
    reg2.setPattern("面(?!包)");
    QString str = "面没了,吃面包也好,吃面食物也可以。";
    qDebug() << str << endl;
    str.replace(reg2,"意大利");
    qDebug() << str << endl;

    //Qt5引入了新的类
    QRegularExpression regExp("hello");
    qDebug() << "QRegularExpression 匹配字符:"
             << regExp.match("hello world!");

    regExp.setPattern("[A-Z]{3,8}");
    regExp.setPatternOptions(QRegularExpression::CaseInsensitiveOption);
    qDebug() << "大小写不敏感匹配:"
             << regExp.match("hello");

    QRegularExpression reDate("^(\\d\\d)/(\\d\\d)/(\\d\\d\\d\\d)$");
    QRegularExpressionMatch match0 = reDate.match("01/10/1949");
    if( match0.hasMatch() ){
        QString strMatch = match0.captured(0);
        QString day = match0.captured(1);
        QString month = match0.captured(2);
        QString year = match0.captured(3);

        qDebug() << "捕获文本:"
                 << "strMatch:" << strMatch << endl
                 << "day:" << day << endl
                 << "month:" << month << endl
                 << "year:" << year;
    }

    QString sPattern;
    sPattern = "^(Jan|Feb|Mar|Apr|May) \\d\\d \\d\\d\\d\\d$";
    QRegularExpression reDate1(sPattern);

    QString ss("Apr 01");
    QRegularExpressionMatch match2;
    match2 = reDate1.match(ss,
                           0,
                           //部分匹配
                           QRegularExpression::PartialPreferCompleteMatch
                           );
    bool bHasMatched = match2.hasMatch();
    bool bPartial = match2.hasPartialMatch();
    qDebug() << bHasMatched << bPartial;

    return a.exec();
}
相关推荐
憧憬成为原神糕手22 分钟前
c++_list
开发语言·c++
idealzouhu25 分钟前
Java 并发编程 —— AQS 抽象队列同步器
java·开发语言
爱吃油淋鸡的莫何25 分钟前
Conda新建python虚拟环境问题
开发语言·python·conda
闲人编程32 分钟前
Python实现日志采集功能
开发语言·python·fluentd·filebeat·日志采集
Sol-itude39 分钟前
关于MATLAB计算3维图的向量夹角总是不正确的问题记录
开发语言·matlab·问题解决·向量
奔驰的小野码1 小时前
java通过org.eclipse.milo实现OPCUA客户端进行连接和订阅
java·开发语言
小川_wenxun1 小时前
优先级队列(堆)
java·开发语言·算法
惜缘若水1 小时前
【SpinalHDL】Scala编程之伴生对象
开发语言·scala·spinalhdl
惜缘若水1 小时前
【SpinalHDL】Scala/SpinalHDL联合编程之实例化
开发语言·scala·spinalhdl
徐霞客3201 小时前
对于C++继承中子类与父类对象同时定义其析构顺序的探究
开发语言·c++