正则表达式

韩顺平 零基础30天学会Java

一、快速入门

  • 提取文章中所有的英文单词

  • 提取文章中所有的数字

  • 提取文章中所有的英文单词和数字

  • 提取百度热榜标题

    package com.hspedu.chapter27.regexp;

    import java.util.regex.Matcher;
    import java.util.regex.Pattern;

    /**

    • @author 易

    • @version 1.0

    • 体验正则表达式
      /
      public class Regexp {
      public static void main(String[] args) {
      String content = "好的,以下是一段包括中文、英文和数字的话:\n" +
      "\n" +
      "在21世纪的今天,随着科技的飞速发展,我们生活的世界变得越来越多元化。" +
      "我热衷于学习英语,尤其是口语交流,因为这有助于我更好地融入全球化的世界。" +
      "每天,我都会花费至少一个小时的时间来练习英语口语,努力提高自己的语言水平。" +
      "同时,我也对数学充满了兴趣,尤其是在解决复杂的数学问题时,我会感到无比的兴奋和满足。" +
      "数学让我学会了逻辑思维和解决问题的能力,也让我更加自信地面对未来的挑战。\n" +
      "\n" +
      "In the 21st century, with the rapid development of technology,";
      //先创建一个Pattern对象,模式对象,可以理解成就是一个正则表达式对象
      // Pattern pattern = Pattern.compile("[a-zA-Z]+");//找单词
      // Pattern pattern = Pattern.compile("[0-9]+");//找数字
      Pattern pattern = Pattern.compile("([0-9]+)|([a-zA-Z]+)");//找字母和数字
      // Pattern pattern = Pattern.compile("<a target="_b lank" title="(\S
      )"");//提取百度热榜标题
      //注意百度热榜标题需要使用group(1)取,才能取到
      //创建一个匹配器对象
      //就是matcher匹配器按照pattern(模式/样式),到content文本中取匹配,找到就返回true,未找到就返回false
      Matcher matcher = pattern.matcher(content);
      //开始循环匹配
      while (matcher.find()) {
      //匹配内容,文本,放到m.group(0)
      System.out.println("找到:" + matcher.group(0));
      }

      }
      }

二、正则表达式基本语法

1、正则表达式基本介绍

  • 一个正则表达式,就是用某种模式去匹配字符串的一个公式
  • 很多编程语言都支持正则表达式进行字符串操作
  • 当正则表达式中出现小括号()的时候,就代表分组,第1个小括号()就是第1组;第2个小括号,就是第2组。

三、正则表达式三个常用类

1、pattern

  • pattern对象是一个正则表达式对象。Pattern 类没有公共构造方法。要创建一个Pattern对象,调用其公共静态方法 compile(),返回一个Pattern对象,该方法接收一个正则表达式作为他的第一个参数

2、Matcher

  • Matcher 对象是对输入字符串进行解释和匹配的引擎,没有公共构造方法,需要调用Pattern的matcher方法来获得一个Matcher对象

3、PatternSyntaxException

  • PatternSyntaxException 是一个非强制异常类,表示一个正则表达式模式中的语法错误

四、分组,捕获,反向引用

分组

反向引用符

  • 反向引用:圆括号的内容被捕获之后,可以在这个括号后背使用,从而写出一个比较使用的匹配模式,这个我们称为反向引用,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部,内部反向引用**\分组号**,外部反向引用**$分组号**

    @Test
    public void test06(){
    String content="12321-333999111";
    String regStr="^\d{5}-(\d)\1{2}(\d)\2{2}(\d)\3{2}$";
    Pattern pattern = Pattern.compile(regStr);
    Matcher matcher = pattern.matcher(content);
    if(matcher.find()){
    System.out.println("满足格式");
    }else{
    System.out.println("不满足");
    }
    }

五、元字符

  • 转移号 \ 在我们是用正则表达式去检索某些特殊字符的时候,需要用到转移符号,否则检索不到结果,甚至会报错
  • 想要学会使用正则表达式必须理解元字符
  • 需要用到转义符的字符: . * + () $ / \ ? [] ^ {}

1、限定符

  • 用于指定其前面的字符和组合项连续出现多少次
  • ?跟在任何一个限定符之后表示非贪婪匹配

2、选择匹配符

  • 在匹配某个字符的时候是选择性的,即可以匹配这个又可以匹配那个,这是需要用到选择匹配符号 |

3、字符匹配符

java正则表达式默认是区分大小写的,如何不区分大小写

  • (?i)abc 表示 abc 都不区分大小写
  • a(?i)bc 表示bc不区分大小写
  • a((?i)b)c 表示只有b不区分大小写
  • Pattern pattern = Pattern.compile(regStr,Pattern.CASE_INSENSITIVE);参数Pattern.CASE_INSENSITIVE 代表不区分大小写
  • \s 匹配任何空白字符(空格、制表符等)
  • \S 匹配任何非空白字符和 \s 正好相反

4、定位符

  • 规定要匹配的字符串出现的位置,比如在字符串的开始还是结束位置

六、String类中使用正则表达式

1、替换功能

public String replaceAll(String regex,String replacement)

@Test
    public void test07(){
        //将下面句子中的1998替换成1999
        String content="1998年12月8日,第二代Java平台的企业版J2EE发布。1999年6月,Sun公司发布了\" +\n" +
                "                \"第二代Java平台(简称为Java2)的3个版本:";
        content=content.replaceAll("1998","1999");
        System.out.println(content);
    }

2、判断功能

 public boolean matches(String regex)

@Test
    public void test08(){
        //验证一个手机号,必须是138或者是139开头的
        String content="13678920463";
        System.out.println(content.matches("13(8|9)\\d{8}"));
    }

3、分割功能

 public String[] split(String regex)

@Test
    public void test09(){
        //要求按照#或者-或者~或者数字来分割下面一句话
        String content="hello#abc-jack12smith~北京";
        String[] split = content.split("#|~|\\d+|-");
        for (String  s :split) {
            System.out.println(s);
        }
相关推荐
黑胡子大叔的小屋44 分钟前
基于springboot的海洋知识服务平台的设计与实现
java·spring boot·毕业设计
ThisIsClark1 小时前
【后端面试总结】深入解析进程和线程的区别
java·jvm·面试
雷神乐乐2 小时前
Spring学习(一)——Sping-XML
java·学习·spring
小林coding2 小时前
阿里云 Java 后端一面,什么难度?
java·后端·mysql·spring·阿里云
V+zmm101342 小时前
基于小程序宿舍报修系统的设计与实现ssm+论文源码调试讲解
java·小程序·毕业设计·mvc·ssm
文大。3 小时前
2024年广西职工职业技能大赛-Spring
java·spring·网络安全
一只小小翠3 小时前
EasyExcel 模板+公式填充
java·easyexcel
m0_748256344 小时前
QWebChannel实现与JS的交互
java·javascript·交互
Jelena技术达人4 小时前
Java爬虫获取1688关键字 item_search接口返回值详细解析
java·开发语言·爬虫
u0107735144 小时前
【字符串】-Lc5-最长回文子串(中心扩展法)
java·算法