正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
Rookie_explorers几秒前
go私有仓库athens搭建
开发语言·后端·golang
TimberWill1 分钟前
MinIO整合SpringBoot实现获取文件夹目录结构及文件内容
java·linux·springboot
崎岖Qiu4 分钟前
【设计模式笔记18】:并发安全与双重检查锁定的单例模式
java·笔记·单例模式·设计模式
曲莫终5 分钟前
spring.main.lazy-initialization配置的实现机制
java·后端·spring
❀͜͡傀儡师13 分钟前
docker部署Docker Compose文件Web管理工具Dockman
java·前端·docker·dockman
沐雪架构师15 分钟前
大模型Agent面试精选题(第五辑)-Agent提示词工程
java·面试·职场和发展
云飞云共享云桌面18 分钟前
SolidWorks服务器怎么实现研发软件多人共享、数据安全管理
java·linux·运维·服务器·数据库·自动化
是喵斯特ya20 分钟前
JNDI注入漏洞分析
java·安全
kong@react22 分钟前
wsl2安装及命令(详细教程)
java·docker·容器
学Linux的语莫26 分钟前
k8s知识点整体概览
java·linux·kubernetes