【Java】正则表达式,校验数据格式的合法性。

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~

个人主页:.29.的博客

学习社区:进去逛一逛~

正则表达式


  • 正则表达式

    • ①可以校验字符串是否满足一定的规则,并用来校验数据格式的合法性。
    • 案例:对象名.matches("[1-9]\\d{5,19}")
      • [1-9]:开头范围1 - 9,即0不在开头
      • \\d:表示数字
      • {5,19}:字符串在6位到20位之间
  • 规则:

  • 细节

    • &&符号表示交集,单一的&符号没有特殊含义,仅表示符号本身。
    • \:转义字符,改变后面那个字符原本的含义。
  • ②根据文本查找满足要求的内容(爬虫)

    • 本地爬虫
    java 复制代码
    //正则表达式相关jar包:
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    //正则表达式,在一段文本中查找满足要求的内容
    public class regexDemo {
    	public static void main(String[] args) {
    		String str = "Java是一种编程语言、Java17是长期版本,Java8和"
    				+ "Java11是企业中用的最多的两个版本。";
    		
    		//1.Pattern表示正则表达式,获取正则表达式实例对象
    		Pattern p = Pattern.compile("Java\\d{0,2}");
    		
    		//获取文本匹配器对象
    		//m:文本匹配器对象
    		//p:规则
    		//str:文本
    		//m要在str中寻找符合规则p的字符子串
    		Matcher m = p.matcher(str);
    		
    		//2.find()使用文本匹配器从头读取文本,不存在满足规则p的子串,返回false,
    		//存在满足规则的字串,记录起始索引和结尾索引+1
    		while(m.find()) {
    			//3.group()根据find()记录的索引截取字符串,[起始索引,结尾索引+1)
    			System.out.print(m.group() + " ");
    		}
    	}
    
    }
    • 带条件爬取: Java(?=8|11|17):?表示左括号前的数据Java,=表示数据Java后拼接的数据,8或11或17,?=在find()记录时,只记录前半部分数据的索引,而?:则获取全部数据。

    • 贪婪爬取(尽可能多地获取数据):

      • 只写+和*表示贪婪匹配(Java中默认就是贪婪爬取)
      • +?表示非贪婪匹配(尽可能少地获取数据)
      • *?表示非贪婪匹配(尽可能少地获取数据)
相关推荐
枫叶v.15 小时前
Agent 分层存储架构设计:从记忆方法到中间件选型
开发语言·python
AskHarries15 小时前
系统提示词、开发者指令和用户输入的优先级
java·前端·数据库
daidaidaiyu16 小时前
ThingsBoard 规则链系统源码分析和自定义定时器
java
sleven fung16 小时前
MinerU与BabelDOC与KTransformers与OpenAI API库
开发语言·python·ai·langchain
小毛驴85016 小时前
spring-boot-maven-plugin,maven-compiler-plugin 功能对比
java·python·maven
萤萤七悬17 小时前
【Python笔记】AI帮实现CLI工具-使用argparse.ArgumentParser接收命令参数
开发语言·笔记·python
iCxhust17 小时前
C# 命令行指令 查看二进制文件
开发语言·单片机·嵌入式硬件·c#·proteus·微机原理·8088单板机
csdn_aspnet17 小时前
Java 霍尔分区算法(Hoare‘s Partition Algorithm)
java·开发语言·算法
霸道流氓气质17 小时前
通义灵码 IDEA 插件完全使用指南
java·ide·intellij-idea
诸葛务农17 小时前
道路行驶条件下电动汽车永磁电机的有效使用寿命及永磁体的失效和回收再利用(下)
java·开发语言·算法