正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String\[\]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
MacroZheng9 分钟前
短短几天,暴涨2.8万Star!又一款编程神器开源!
java·人工智能·后端
PinkSun13 分钟前
平台线程池用了3年很顺手,换成虚拟线程后我后悔了
后端
达达尼昂17 分钟前
Claude : 如何设计可控的agent-loops
前端·人工智能·后端
lambdax18 分钟前
Celery 心跳任务内存膨胀排查与修复全记录
后端
SamDeepThinking22 分钟前
函数式编程:用BiFunction消除多类型分支的代码重复
java·后端·面试
IT_陈寒1 小时前
Redis持久化丢失数据的坑,这次终于被我填平了
前端·人工智能·后端
葫芦和十三2 小时前
图解 MongoDB 24|分片为什么存在:垂直扩容的天花板
后端·mongodb·agent
有趣的老凌2 小时前
用 Vibe Coding 搭了一个完整小程序「一定能成」
前端·javascript·后端
葫芦和十三9 小时前
图解 MongoDB 23|两地三中心:跨可用区部署怎么扛机房故障
后端·mongodb·agent
勇哥java实战分享11 小时前
PaddleOCR 太慢?我换成 RapidOCR 后,速度直接起飞
后端