正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
缘来是庄21 分钟前
设计模式之访问者模式
java·设计模式·访问者模式
Bug退退退1231 小时前
RabbitMQ 高级特性之死信队列
java·分布式·spring·rabbitmq
梵高的代码色盘1 小时前
后端树形结构
java
代码的奴隶(艾伦·耶格尔)1 小时前
后端快捷代码
java·开发语言
虾条_花吹雪1 小时前
Chat Model API
java
双力臂4041 小时前
MyBatis动态SQL进阶:复杂查询与性能优化实战
java·sql·性能优化·mybatis
六毛的毛2 小时前
Springboot开发常见注解一览
java·spring boot·后端
AntBlack2 小时前
拖了五个月 ,不当韭菜体验版算是正式发布了
前端·后端·python
31535669132 小时前
一个简单的脚本,让pdf开启夜间模式
前端·后端
程序漫游人2 小时前
centos8.5安装jdk21详细安装教程
java·linux