韩顺平 零基础30天学会Java
一、快速入门
-
提取文章中所有的英文单词
-
提取文章中所有的数字
-
提取文章中所有的英文单词和数字
-
提取百度热榜标题
package com.hspedu.chapter27.regexp;
import java.util.regex.Matcher;
import java.util.regex.Pattern;/**
-
@author 易
-
@version 1.0
-
体验正则表达式
/
public class Regexp {
public static void main(String[] args) {
String content = "好的,以下是一段包括中文、英文和数字的话:\n" +
"\n" +
"在21世纪的今天,随着科技的飞速发展,我们生活的世界变得越来越多元化。" +
"我热衷于学习英语,尤其是口语交流,因为这有助于我更好地融入全球化的世界。" +
"每天,我都会花费至少一个小时的时间来练习英语口语,努力提高自己的语言水平。" +
"同时,我也对数学充满了兴趣,尤其是在解决复杂的数学问题时,我会感到无比的兴奋和满足。" +
"数学让我学会了逻辑思维和解决问题的能力,也让我更加自信地面对未来的挑战。\n" +
"\n" +
"In the 21st century, with the rapid development of technology,";
//先创建一个Pattern对象,模式对象,可以理解成就是一个正则表达式对象
// Pattern pattern = Pattern.compile("[a-zA-Z]+");//找单词
// Pattern pattern = Pattern.compile("[0-9]+");//找数字
Pattern pattern = Pattern.compile("([0-9]+)|([a-zA-Z]+)");//找字母和数字
// Pattern pattern = Pattern.compile("<a target="_b lank" title="(\S)"");//提取百度热榜标题
//注意百度热榜标题需要使用group(1)取,才能取到
//创建一个匹配器对象
//就是matcher匹配器按照pattern(模式/样式),到content文本中取匹配,找到就返回true,未找到就返回false
Matcher matcher = pattern.matcher(content);
//开始循环匹配
while (matcher.find()) {
//匹配内容,文本,放到m.group(0)
System.out.println("找到:" + matcher.group(0));
}}
}
-
二、正则表达式基本语法
1、正则表达式基本介绍
- 一个正则表达式,就是用某种模式去匹配字符串的一个公式
- 很多编程语言都支持正则表达式进行字符串操作
- 当正则表达式中出现小括号()的时候,就代表分组,第1个小括号()就是第1组;第2个小括号,就是第2组。
三、正则表达式三个常用类
1、pattern
- pattern对象是一个正则表达式对象。Pattern 类没有公共构造方法。要创建一个Pattern对象,调用其公共静态方法 compile(),返回一个Pattern对象,该方法接收一个正则表达式作为他的第一个参数
2、Matcher
- Matcher 对象是对输入字符串进行解释和匹配的引擎,没有公共构造方法,需要调用Pattern的matcher方法来获得一个Matcher对象
3、PatternSyntaxException
- PatternSyntaxException 是一个非强制异常类,表示一个正则表达式模式中的语法错误
四、分组,捕获,反向引用
分组
反向引用符
-
反向引用:圆括号的内容被捕获之后,可以在这个括号后背使用,从而写出一个比较使用的匹配模式,这个我们称为反向引用,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部,内部反向引用**\分组号**,外部反向引用**$分组号**
@Test
public void test06(){
String content="12321-333999111";
String regStr="^\d{5}-(\d)\1{2}(\d)\2{2}(\d)\3{2}$";
Pattern pattern = Pattern.compile(regStr);
Matcher matcher = pattern.matcher(content);
if(matcher.find()){
System.out.println("满足格式");
}else{
System.out.println("不满足");
}
}
五、元字符
- 转移号 \ 在我们是用正则表达式去检索某些特殊字符的时候,需要用到转移符号,否则检索不到结果,甚至会报错
- 想要学会使用正则表达式必须理解元字符
- 需要用到转义符的字符: . * + () $ / \ ? [] ^ {}
1、限定符
- 用于指定其前面的字符和组合项连续出现多少次
- ?跟在任何一个限定符之后表示非贪婪匹配
2、选择匹配符
- 在匹配某个字符的时候是选择性的,即可以匹配这个又可以匹配那个,这是需要用到选择匹配符号 |
3、字符匹配符
java正则表达式默认是区分大小写的,如何不区分大小写
- (?i)abc 表示 abc 都不区分大小写
- a(?i)bc 表示bc不区分大小写
- a((?i)b)c 表示只有b不区分大小写
- Pattern pattern = Pattern.compile(regStr,Pattern.CASE_INSENSITIVE);参数Pattern.CASE_INSENSITIVE 代表不区分大小写
- \s 匹配任何空白字符(空格、制表符等)
- \S 匹配任何非空白字符和 \s 正好相反
4、定位符
- 规定要匹配的字符串出现的位置,比如在字符串的开始还是结束位置
六、String类中使用正则表达式
1、替换功能
public String replaceAll(String regex,String replacement)
@Test
public void test07(){
//将下面句子中的1998替换成1999
String content="1998年12月8日,第二代Java平台的企业版J2EE发布。1999年6月,Sun公司发布了\" +\n" +
" \"第二代Java平台(简称为Java2)的3个版本:";
content=content.replaceAll("1998","1999");
System.out.println(content);
}
2、判断功能
public boolean matches(String regex)
@Test
public void test08(){
//验证一个手机号,必须是138或者是139开头的
String content="13678920463";
System.out.println(content.matches("13(8|9)\\d{8}"));
}
3、分割功能
public String[] split(String regex)
@Test
public void test09(){
//要求按照#或者-或者~或者数字来分割下面一句话
String content="hello#abc-jack12smith~北京";
String[] split = content.split("#|~|\\d+|-");
for (String s :split) {
System.out.println(s);
}