Java:正则表达式案例:爬数据,重复数据替换,数据分割

使用正则表达式查找一段文本中的内容

需求:请把下面文本中的电话,邮箱,座机号码,热线都爬取出来。

java 复制代码
String data ="电话:1866668888,18699997777\n"+
"或者联系邮箱: [email protected],\n"+
"座机电话:01036517895,010-98951256\n"+
"邮箱: [email protected],\n"+
"邮箱2: [email protected],\n"+
"热线电话:400-618-9090 , 400-618-4000,4006184000,4006189090";

// 1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|"+
"(1[3-9]\\d{9}) | (O\\d{2,5}-?\\d{5,15}) | 400-? \\d{3,8}-?\\d{3,8}";

// 2.把正则表达式封装成一个pattern对象
Pattern pattern = Pattern.compile(regex);

//3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);

//4.通过匹配器开始去内容中查找信息
while(matcher.find()){
system.out.println(matcher.group());//取出信息

正则表达式用于搜索替换、分割内容

搜索替换

分割

"\+"代表的意思是重复一次以上的数据

相关推荐
斯普信云原生组3 分钟前
Docker构建自定义的镜像
java·spring cloud·docker
前端页面仔6 分钟前
易语言是什么?易语言能做什么?
开发语言·安全
wangjinjin1806 分钟前
使用 IntelliJ IDEA 安装通义灵码(TONGYI Lingma)插件,进行后端 Java Spring Boot 项目的用户用例生成及常见问题处理
java·spring boot·intellij-idea
wtg44527 分钟前
使用 Rest-Assured 和 TestNG 进行购物车功能的 API 自动化测试
java
树叶@25 分钟前
Python数据分析7
开发语言·python
wydaicls29 分钟前
十一.C++ 类 -- 面向对象思想
开发语言·c++
白宇横流学长31 分钟前
基于SpringBoot实现的大创管理系统设计与实现【源码+文档】
java·spring boot·后端
fat house cat_1 小时前
【redis】线程IO模型
java·redis
Biomamba生信基地1 小时前
R语言基础| 下载、安装
开发语言·r语言·生信·医药
姜君竹1 小时前
QT的工程文件.pro文件
开发语言·c++·qt·系统架构