正则表达式

所谓正则表达式 ,由一些特定的字符组成,代表的是一个规则。作用如下:

(1)用来校验数据格式是否合法

(2)在一段文本中查找满足要求的内容

(3)用于搜索替换、分割内容

String类提供了matches方法,判断字符串是否匹配正则表达式。

符号 含义 举例
? 0次或1次 \\d?
* 0次或多次 \\d* (abc)*
+ 1次或多次 \\d+ (abc)+
{} 具体次数 {7,19}
(?i) 忽略后面字符的大小写 (?i)abc
a((?i)b)c 只忽略b的大小写 a((?i)b)c
[] 里面的内容出现一次 [abc]
^ 取反 [^abc]
&& 交集,不能写单个的& [a-z&&m-p]
. 任意字符 \n 回车符号不匹配
\ 转义字符 \\d
\\d 0-9 \\d+
\\D 非0-9 \\D+
\\s 空白字符
\\S 非空白字符 [^\s]
\\w 单词字符 [a-zA-Z_0-9]
\\W 非单词字符 [^\w]
() 分组 a(bc)+
| 写在方括号外面表示并集 ab|AB

案例:

java 复制代码
String data ="电话:18621312888,186231231777\n" +"或者联系邮箱:[email protected],\n" +"座机电话:010097423895,010-98951256\n" +        "邮箱:[email protected],\n" +"邮箱2:[email protected],\n" +        "热线电话:401-638-9090 ,400-618-4990,4002312000,4002356890";
//1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|" +  
"(1[3-9]\\d{9})|(0\\d{2,5}-?\\d{5,15})|400-?\\d{3,8}-?\\d{3,8}";
// 2.把正则表达式封装成一个Pattern对象
Pattern pattern = Pattern.compile(regex);
// 3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);
// 4.通过匹配器开始去内容中查找信息
while(matcher.find()){    
	System.out.println(matcher.group()); //取出信息
}

来源:黑马课程

相关推荐
亚林瓜子3 分钟前
AWS Elastic Beanstalk控制台部署Spring极简工程
java·spring·云计算·aws·eb
2401_cf10 分钟前
如何创建maven项目
java·maven·intellij-idea
C4程序员2 小时前
Java百度身份证识别接口实现【配置即用】
java·开发语言
炒空心菜菜2 小时前
MapReduce 实现 WordCount
java·开发语言·ide·后端·spark·eclipse·mapreduce
zy happy2 小时前
搭建运行若依微服务版本ruoyi-cloud最新教程
java·spring boot·spring cloud·微服务·ruoyi
芯眼2 小时前
STM32启动文件详解(重点)
java·开发语言·c++·stm32·单片机·mybatis
想躺平的小农3 小时前
EasyExcel详解
java
慧一居士3 小时前
EasyExcel集成使用总结与完整示例
java·excel
呦呦彬3 小时前
【问题排查】easyexcel日志打印Empty row!
java·开发语言·log4j
九章云极AladdinEdu3 小时前
GPU与NPU异构计算任务划分算法研究:基于强化学习的Transformer负载均衡实践
java·开发语言·人工智能·深度学习·测试工具·负载均衡·transformer