正则表达式

所谓正则表达式 ,由一些特定的字符组成,代表的是一个规则。作用如下:

(1)用来校验数据格式是否合法

(2)在一段文本中查找满足要求的内容

(3)用于搜索替换、分割内容

String类提供了matches方法,判断字符串是否匹配正则表达式。

符号 含义 举例
? 0次或1次 \\d?
* 0次或多次 \\d* (abc)*
+ 1次或多次 \\d+ (abc)+
{} 具体次数 {7,19}
(?i) 忽略后面字符的大小写 (?i)abc
a((?i)b)c 只忽略b的大小写 a((?i)b)c
[] 里面的内容出现一次 [abc]
^ 取反 [^abc]
&& 交集,不能写单个的& [a-z&&m-p]
. 任意字符 \n 回车符号不匹配
\ 转义字符 \\d
\\d 0-9 \\d+
\\D 非0-9 \\D+
\\s 空白字符
\\S 非空白字符 [^\s]
\\w 单词字符 [a-zA-Z_0-9]
\\W 非单词字符 [^\w]
() 分组 a(bc)+
| 写在方括号外面表示并集 ab|AB

案例:

java 复制代码
String data ="电话:18621312888,186231231777\n" +"或者联系邮箱:boniu@itcast.cn,\n" +"座机电话:010097423895,010-98951256\n" +        "邮箱:7826448211@qq.com,\n" +"邮箱2:dlei0009@163.com,\n" +        "热线电话:401-638-9090 ,400-618-4990,4002312000,4002356890";
//1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|" +  
"(1[3-9]\\d{9})|(0\\d{2,5}-?\\d{5,15})|400-?\\d{3,8}-?\\d{3,8}";
// 2.把正则表达式封装成一个Pattern对象
Pattern pattern = Pattern.compile(regex);
// 3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);
// 4.通过匹配器开始去内容中查找信息
while(matcher.find()){    
	System.out.println(matcher.group()); //取出信息
}

来源:黑马课程

相关推荐
wuminyu7 小时前
专家视角看Java字节码加载与存储指令机制
java·linux·c语言·jvm·c++
callJJ9 小时前
Spring Data Redis 两种编程模型详解:同步 vs 响应式
java·spring boot·redis·python·spring
wbs_scy9 小时前
Linux线程同步与互斥(三):线程同步深度解析之POSIX 信号量与环形队列生产者消费者模型,从原理到源码彻底吃透
java·开发语言
jinanwuhuaguo11 小时前
(第三十三篇)五月的文明奠基:OpenClaw 2026.5.2版本的文明级解读
android·java·开发语言·人工智能·github·拓扑学·openclaw
xmjd msup11 小时前
spring security 超详细使用教程(接入springboot、前后端分离)
java·spring boot·spring
9523612 小时前
SpringBoot统一功能处理
java·spring boot·后端
Lyyaoo.12 小时前
优惠券秒杀业务分析
java·开发语言
消失的旧时光-194312 小时前
统一并发模型:线程、Reactor、协程本质是一件事(从线程到协程 · 第6篇·终章)
java·python·算法
勿忘初心122112 小时前
Java 国密 SM4 加密工具类实战(Hutool + BouncyCastle)|企业级数据加密 + 兼容 JDK8
java·数据安全·数据加密·后端开发·企业级开发·国密 sm4
庞轩px12 小时前
第8篇:原子类与CAS底层原理——无锁并发的实现
java·cas·乐观锁·aba·无锁编程·自旋