正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
溟洵2 分钟前
Qt 窗口 工具栏QToolBar、状态栏StatusBar
开发语言·前端·数据库·c++·后端·qt
ppo9214 分钟前
MCP简单应用:使用SpringAI + Cline + DeepSeek实现AI创建文件并写入内容
人工智能·后端
创码小奇客21 分钟前
Talos 使用全攻略:从基础到高阶,常见问题一网打尽
java·后端·架构
Re27521 分钟前
ThreadLocal 入门:搞懂线程私有变量
后端
jackzhuoa1 小时前
java小白闯关记第一天(两个数相加)
java·算法·蓝桥杯·期末
Rover.x1 小时前
内存泄漏问题排查
java·linux·服务器·缓存
midsummer_woo1 小时前
基于spring boot的纺织品企业财务管理系统(源码+论文)
java·spring boot·后端
zc-code1 小时前
Spring Boot + @RefreshScope:动态刷新配置的终极指南
java·spring boot·后端
何中应1 小时前
EasyExcel使用(二:写出)
java·后端·maven·excel
旭日东升的xu.2 小时前
Python(09)正则表达式
正则表达式