Java:正则表达式案例:爬数据,重复数据替换,数据分割

使用正则表达式查找一段文本中的内容

需求:请把下面文本中的电话,邮箱,座机号码,热线都爬取出来。

java 复制代码
String data ="电话:1866668888,18699997777\n"+
"或者联系邮箱: [email protected],\n"+
"座机电话:01036517895,010-98951256\n"+
"邮箱: [email protected],\n"+
"邮箱2: [email protected],\n"+
"热线电话:400-618-9090 , 400-618-4000,4006184000,4006189090";

// 1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|"+
"(1[3-9]\\d{9}) | (O\\d{2,5}-?\\d{5,15}) | 400-? \\d{3,8}-?\\d{3,8}";

// 2.把正则表达式封装成一个pattern对象
Pattern pattern = Pattern.compile(regex);

//3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);

//4.通过匹配器开始去内容中查找信息
while(matcher.find()){
system.out.println(matcher.group());//取出信息

正则表达式用于搜索替换、分割内容

搜索替换

分割

"\+"代表的意思是重复一次以上的数据

相关推荐
6<73 分钟前
【go】静态类型与动态类型
开发语言·后端·golang
柚几哥哥4 分钟前
IntelliJ IDEA全栈Git指南:从零构建到高效协作开发
java·git·intellij-idea
技术liul8 分钟前
解决Spring Boot Configuration Annotation Processor not configured
java·spring boot·后端
chushiyunen20 分钟前
dom操作笔记、xml和document等
xml·java·笔记
whisperrr.20 分钟前
【spring01】Spring 管理 Bean-IOC,基于 XML 配置 bean
xml·java·spring
chushiyunen22 分钟前
tomcat使用笔记、启动失败但是未打印日志
java·笔记·tomcat
天上掉下来个程小白29 分钟前
HttpClient-03.入门案例-发送POST方式请求
java·spring·httpclient·苍穹外卖
ModestCoder_38 分钟前
将一个新的机器人模型导入最新版isaacLab进行训练(以unitree H1_2为例)
android·java·机器人
a180079310801 小时前
软件工程面试题(二十二)
java·面试·软件工程
RainbowSea1 小时前
4. RabbitMQ 发布确认的配置详细说明
java·消息队列·rabbitmq