正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
不会吃萝卜的兔子10 分钟前
springboot websocket 原理
spring boot·后端·websocket
涛声依旧32 分钟前
基于springBoot鲜花商城小程序
java·spring·微信小程序
Fency咖啡1 小时前
Spring Boot 内置日志框架 Logback - 以及 lombok 介绍
spring boot·后端·logback
尘埃不入你眼眸2 小时前
服务器安装Java与nginx与nacos
java·服务器·nginx
karry_k2 小时前
什么是Fork/Join?
java·后端
卷Java2 小时前
小程序前端功能更新说明
java·前端·spring boot·微信小程序·小程序·uni-app
magicalmuggle2 小时前
Java 后端开发复习指南
java·spring
karry_k2 小时前
四大函数式接口与Stream流式计算
后端
南方者3 小时前
【JAVA】【BUG】经常出现的典型 bug 及解决办法
java·oracle·bug
Cosolar3 小时前
什么是 ONNX Runtime?
后端·架构