Java:正则表达式案例:爬数据,重复数据替换,数据分割

使用正则表达式查找一段文本中的内容

需求:请把下面文本中的电话,邮箱,座机号码,热线都爬取出来。

java 复制代码
String data ="电话:1866668888,18699997777\n"+
"或者联系邮箱: boniu@itcast.cn,\n"+
"座机电话:01036517895,010-98951256\n"+
"邮箱: bozai@itcast.cn,\n"+
"邮箱2: dleiooo9@163.com,\n"+
"热线电话:400-618-9090 , 400-618-4000,4006184000,4006189090";

// 1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|"+
"(1[3-9]\\d{9}) | (O\\d{2,5}-?\\d{5,15}) | 400-? \\d{3,8}-?\\d{3,8}";

// 2.把正则表达式封装成一个pattern对象
Pattern pattern = Pattern.compile(regex);

//3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);

//4.通过匹配器开始去内容中查找信息
while(matcher.find()){
system.out.println(matcher.group());//取出信息

正则表达式用于搜索替换、分割内容

搜索替换

分割

"\+"代表的意思是重复一次以上的数据

相关推荐
IT方大同几秒前
(实时操作系统)线程管理
c语言·开发语言·嵌入式硬件
阿kun要赚马内16 分钟前
Python面向对象:@property装饰器
开发语言·前端·python
sunwenjian88617 分钟前
Java进阶--IO流
java·开发语言
wildlily842718 分钟前
C++ Primer 第5版章节题 第十三章(二)
开发语言·c++
意法半导体STM3229 分钟前
【官方原创】STM32H7双核芯片通过 STlink连接失败问题分析 LAT1654
开发语言·前端·javascript·stm32·单片机·嵌入式硬件
深蓝海拓33 分钟前
使用@property将类方法包装为属性
开发语言·python
客卿12338 分钟前
滑动窗口--模板
java·算法
xiaoye-duck1 小时前
【C++:unordered_set和unordered_map】 深度解析:使用、差异、性能与场景选择
开发语言·c++·stl
zjjsctcdl1 小时前
java与mysql连接 使用mysql-connector-java连接msql
java·开发语言·mysql
格林威1 小时前
Baumer相机锂电池极片裁切毛刺检测:防止内部短路的 5 个核心方法,附 OpenCV+Halcon 实战代码!
开发语言·人工智能·数码相机·opencv·计算机视觉·c#·视觉检测