Java基础第21天-正则表达式

正则表达式是对字符串执行模式匹配的技术

如果想灵活的运用正则表达式,必须了解其中各种元字符的功能,元字符从功能上大致分为:

  1. 限定符
  2. 选择匹配符
  3. 分组组合和反向引用符
  4. 特殊字符
  5. 字符匹配符
  6. 定位符
  • 转义号\\:在我们使用正则表达式去检索某些特殊字符的时候,需要用到转义符号,否则检索不到结果,甚至会报错,即我们去写需要检索的特殊字符时(如:. * + () $ / \ ? [] ^ {} ),需要在前面加上\\
  • 字符匹配符

其中\\w包含下划线_

\\s表示匹配任何空白字符比如空格、制表符等;

\\S表示匹配任何非空白字符;

Java正则表达式默认是区分字母大小写的,实现不区分大小写如下:

还有一种方式是在创建正则表达式时,在Pattern.compile(regEx,Pattern.CASE_INSENSITIVE)写下黑色加粗部分

  • 选择匹配符

在匹配某个字符串的时候是选择性的,即:既可以匹配这个,又可以匹配那个,这个时候就需要用到选择匹配符 | 。如ab|cd,匹配ab或cd

  • 限定符

用于指定其前面的字符和组合项连续出现多少次

java匹配默认贪婪匹配,即尽可能匹配多的如1{4,5}表示匹配1111或11111,但是一般都默认匹配多的也就是11111,如果想要匹配到短的字符即非贪婪匹配,则需要在限定符后加一个?

  • 定位符

定位符规定要匹配的字符串出现的位置,比如在字符串的开始还是在结束的位置

  • 分组

我们可以用圆括号组成一个比较复杂的匹配模式,那么一个圆括号的部分我们可以看作是一个子表达式/一个分组

  • 捕获

把正则表达式中子表达式/分组匹配的内容,保存到内存中以数字编号或显式命名的组里,方便后面引用,从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推。组0代表的是整个正则式

  • 正则表达式的三个常用类Pattern、Matcher、PatternSyntaxException
  1. Pattern类:pattern对象是一个正则表达式对象,Pattern类没有公共构造方法,要创建一个Pattern对象,调用其公共静态方法,它返回一个Pattern对象,该方法接受一个在正则表达式作为他的第一个参数
  2. Matcher类:Matcher对象是对输入字符串进行解释和匹配的引擎,与Pattern类一样,Matcher也没有公共构造方法,需要调用Pattern对象的matcher方法来获得一个Matcher对象
  3. PatternSyntaxException是一个非强制异常类,它表示一个正则表达式模式中的语法错误
  • 反向引用

圆括号的内容被捕获后,可以在这个括号后被使用,从而写出一个比较实用的匹配模式,这个我们称为反向引用,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部,内部反向引用\\分组号,外部反向引用$分组号,如(\\d)\\1就可以找出连续两个相同的数字,(\\d)会匹配到一个任意数字,\\1反向引用会引用第一个()即(\\d)捕获到的内容,从而实现寻找两个连续的相同的数字的效果,同理如果是(\\d)(\\d)\\2\\1就会找到ABBA类型的数字,因为\\2表示与第二个括号捕获的内容相同。

相关推荐
isyangli_blog2 分钟前
(1-4)Java Object类、Final、注解、设计模式、抽象类、接口、内部类
java·开发语言
三块钱079410 分钟前
【原创】基于视觉大模型gemma-3-4b实现短视频自动识别内容并生成解说文案
开发语言·python·音视频
易只轻松熊10 分钟前
C++(20): 文件输入输出库 —— <fstream>
开发语言·c++·算法
芯眼13 分钟前
ALIENTEK精英STM32F103开发板 实验0测试程序详解
开发语言·c++·stm32·单片机·嵌入式硬件·社交电子
青出于兰1 小时前
C语言| 指针变量的定义
c语言·开发语言
玉笥寻珍1 小时前
筑牢信息安全防线:涉密计算机与互联网隔离的理论实践与风险防控
开发语言·计算机网络·安全·计算机外设·php·安全架构·安全性测试
蓝莓味柯基1 小时前
Lodash isEqual 方法源码实现分析
开发语言
秋野酱1 小时前
Spring Boot 项目的计算机专业论文参考文献
java·spring boot·后端
秋野酱1 小时前
python项目参考文献
开发语言·python
士别三日&&当刮目相看1 小时前
数据结构*优先级队列(堆)
java·数据结构