java之贪婪爬取和非贪婪爬取

复制代码
public class RegexDemo6 {
    public static void main(String[] args) {
        String str="java自从95年问世以来,abbbbbbbbbbbbbbbbbaaaaaaaaaaaaaaaa" +
                " 经历了很多版本,目前企业中用的最多是java8和java11,"+
                "因为这俩个是长期版本,下一个长期支持版本是java17,相信在未来不就java17也会逐渐登上历史舞台";

        //贪婪爬取的意思就是要尽可能获取多的数据
        //非贪婪爬取的意思就是尽可能少的获取数据
        //贪婪爬取一般是在要爬取的数据后面加一个+号
        //非贪婪爬取一般是在要爬取的数据后面加一个+号和?号

        String regex="ab+";
        //利用正则表达式来获取到regex
        Pattern p = Pattern.compile(regex);
        //然后再用文本匹配器去获取
        Matcher m = p.matcher(str);
        //再用while循环去遍历
        while(m.find()) {
            System.out.println(m.group());
        }
    }
}

这是贪婪爬取

非贪婪爬取:

相关推荐
努力努力再努力wz1 小时前
【Linux网络系列】:JSON+HTTP,用C++手搓一个web计算器服务器!
java·linux·运维·服务器·c语言·数据结构·c++
魂梦翩跹如雨1 小时前
死磕排序算法:手撕快速排序的四种姿势(Hoare、挖坑、前后指针 + 非递归)
java·数据结构·算法
带刺的坐椅8 小时前
Solon AI Skills 会是 Agent 的未来吗?
java·agent·langchain4j·solon-ai
jacGJ8 小时前
记录学习--文件读写
java·前端·学习
哈哈不让取名字8 小时前
基于C++的爬虫框架
开发语言·c++·算法
花间相见8 小时前
【JAVA开发】—— Nginx服务器
java·开发语言·nginx
扶苏-su9 小时前
Java---Properties 类
java·开发语言
cypking9 小时前
四、CRUD操作指南
java
2301_7806698610 小时前
文件字节流输出、文件复制、关闭流的方法
java
一条咸鱼_SaltyFish10 小时前
远程鉴权中心设计:HTTP 与 gRPC 的技术决策与实践
开发语言·网络·网络协议·程序人生·http·开源软件·个人开发