正则表达式使用知识(日常翻阅)

正则表达式使用

一、字符匹配

1. 普通字符
  • 描述:直接匹配字符本身。
  • 示例
    • abc 匹配字符串中的 "abc"。
    • Hello 匹配字符串中的 "Hello"。
2. 特殊字符
  • .(点号)
    • 描述:匹配任意单个字符(除换行符外)。
    • 示例
      • a.c 匹配 "abc", "adc", "a c"(注意空格也是一个字符)。
      • 1.1 匹配 "1a1", "121" 等。
  • \d
    • 描述:匹配数字(0-9)。
    • 示例
      • \d{3} 匹配 "123", "456" 等三位数字。
      • \d+ 匹配一个或多个数字。
  • \w
    • 描述 :匹配字母、数字或下划线(等价于 [A-Za-z0-9_])。
    • 示例
      • \w+ 匹配 "username", "Password123" 等。
      • \w{5} 匹配恰好五个字母、数字或下划线的组合。
  • \s
    • 描述:匹配空白字符(空格、制表符、换行符等)。
    • 示例
      • \s+ 匹配一个或多个空白字符。
      • a\sb 匹配 "a b"(中间有一个空格)。
3. 字符集
  • [abc]
    • 描述:匹配方括号内的任意单个字符。
    • 示例
      • [aeiou] 匹配任意一个元音字母。
      • [0-9] 匹配任意一个数字。
  • [^abc]
    • 描述:匹配不在方括号内的任意单个字符。
    • 示例
      • [^0-9] 匹配任意一个非数字字符。
      • [^A-Za-z] 匹配任意一个非字母字符。

二、量词

1. +(加号)
  • 描述:匹配前面的字符或子表达式一次或多次。
  • 示例
    • a+ 匹配 "a", "aa", "aaa" 等。
    • \d+ 匹配一个或多个数字。
2. *(星号)
  • 描述:匹配前面的字符或子表达式零次或多次。
  • 示例
    • a* 匹配 "", "a", "aa", "aaa" 等。
    • \s* 匹配零个或多个空白字符。
3. ?(问号)
  • 描述:匹配前面的字符或子表达式零次或一次(可选)。
  • 示例
    • colou?r 匹配 "color" 或 "colour"。
    • https? 匹配 "http" 或 "https"。
4. {n,m}(重复次数)
  • 描述 :匹配前面的字符或子表达式至少 n 次,至多 m 次。
  • 示例
    • \d{3,5} 匹配 3 到 5 位数字。
    • a{2,4} 匹配 "aa", "aaa", "aaaa"。

三、锚点

1. ^(脱字符号)
  • 描述:匹配字符串的开头。
  • 示例
    • ^Hello 匹配以 "Hello" 开头的字符串。
    • ^1 匹配以数字 "1" 开头的字符串。
2. $(美元符号)
  • 描述:匹配字符串的结尾。
  • 示例
    • world$ 匹配以 "world" 结尾的字符串。
    • \d$ 匹配以数字结尾的字符串。
3. \b(单词边界)
  • 描述:匹配单词的边界(如空格、标点符号或字符串的开头/结尾)。
  • 示例
    • \bcat\b 匹配独立的单词 "cat"。
    • \b\w+\b 匹配一个完整的单词。
4. \B(非单词边界)
  • 描述:匹配非单词边界。
  • 示例
    • \Bcat\B 匹配 "category" 中的 "cat"。
    • \B\w+\B 匹配单词的一部分。
5. 正向先行断言 (?=...)
  • 描述:匹配后面紧跟特定模式的位置,但不消耗字符。
  • 示例
    • a(?=b) 匹配后面紧跟 "b" 的 "a"。
    • \d+(?=%) 匹配百分比符号前的数字。
6. 负向先行断言 (?!...)
  • 描述:匹配后面不紧跟特定模式的位置。
  • 示例
    • a(?!b) 匹配后面不跟 "b" 的 "a"。
    • \d+(?!\.) 匹配不以点号结尾的数字。

四、综合案例及解释

  1. 匹配邮箱地址

    regex 复制代码
    [\w.-]+@[\w.-]+\.\w+
    • 解释
      • [\w.-]+:匹配用户名(允许字母、数字、下划线、点和短横线)。
      • @:匹配邮箱符号。
      • [\w.-]+:匹配域名。
      • \.\w+:匹配顶级域名(如 .com, .cn)。
  2. 匹配电话号码

    regex 复制代码
    (\+86)?\d{11}
    • 解释
      • (\+86)?:匹配可选的国际区号 "+86"。
      • \d{11}:匹配 11 位数字(中国手机号码)。
  3. 匹配日期(YYYY-MM-DD 格式)

    regex 复制代码
    \d{4}-\d{2}-\d{2}
    • 解释
      • \d{4}:匹配四位年份。
      • -\d{2}:匹配月份和日期。
  4. 匹配包含数字的单词

    regex 复制代码
    \b\w*\d\w*\b
    • 解释
      • \b:确保匹配完整的单词。
      • \w*\d\w*:匹配包含至少一个数字的单词。
  5. 匹配特定格式的URL

    regex 复制代码
    https?://[\w.-]+(\.[\w-]+)+
    • 解释
      • https?:匹配 "http" 或 "https"。
      • ://:匹配协议和域名的分隔符。
      • [\w.-]+:匹配域名主体。
      • (\.[\w-]+)+:匹配顶级域名(如 .com, .cn)。
相关推荐
我命由我123452 小时前
Kotlin 数据容器 - List(List 概述、创建 List、List 核心特性、List 元素访问、List 遍历)
java·开发语言·jvm·windows·java-ee·kotlin·list
im_AMBER3 小时前
学习日志19 python
python·学习
武子康4 小时前
Java-80 深入浅出 RPC Dubbo 动态服务降级:从雪崩防护到配置中心秒级生效
java·分布式·后端·spring·微服务·rpc·dubbo
mortimer6 小时前
安装NVIDIA Parakeet时,我遇到的两个Pip“小插曲”
python·github
@昵称不存在6 小时前
Flask input 和datalist结合
后端·python·flask
赵英英俊7 小时前
Python day25
python
东林牧之7 小时前
Django+celery异步:拿来即用,可移植性高
后端·python·django
何双新7 小时前
基于Tornado的WebSocket实时聊天系统:从零到一构建与解析
python·websocket·tornado
YuTaoShao7 小时前
【LeetCode 热题 100】131. 分割回文串——回溯
java·算法·leetcode·深度优先
源码_V_saaskw7 小时前
JAVA图文短视频交友+自营商城系统源码支持小程序+Android+IOS+H5
java·微信小程序·小程序·uni-app·音视频·交友