正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
洛森唛28 分钟前
ElasticSearch查询语句Query String详解:从入门到精通
后端·elasticsearch
用户83071968408236 分钟前
Spring Boot 集成 RabbitMQ :8 个最佳实践,杜绝消息丢失与队列阻塞
spring boot·后端·rabbitmq
小兔崽子去哪了1 小时前
Java 自动化部署
java·后端
Selicens1 小时前
git批量删除本地多余分支
前端·git·后端
哈密瓜的眉毛美1 小时前
Java 基础补充:零基础学Java | Scanner 类详解
后端
ma_king1 小时前
入门 java 和 数据库
java·数据库·后端
平平无奇的开发仔1 小时前
Mybaitis 项目多模块多依赖xml加载classpath:和classpath*:的区别
后端
后端AI实验室1 小时前
我用Cursor开发了3个月,整理出这套提效4倍的工作流
java·ai
神奇小汤圆1 小时前
MySQL的10种高级SQL,性能飞升
后端
AI探索者1 小时前
LangGraph 人工干预:Human-in-the-loop 机制详解
后端