正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
Mahir087 小时前
Spring 循环依赖深度解密:从问题本质到三级缓存源码级解析
java·后端·spring·缓存·面试·循环依赖·三级缓存
RyFit8 小时前
SpringAI 常见问题及解决方案大全
java·ai
石山代码8 小时前
C++ 内存分区 堆区
java·开发语言·c++
绝知此事9 小时前
【算法突围 01】线性结构与哈希表:后端开发的收纳术
java·数据结构·算法·面试·jdk·散列表
无风听海9 小时前
C# 隐式转换深度解析
java·开发语言·c#
一只大袋鼠9 小时前
Git 进阶(二):分支管理、暂存栈、远程仓库与多人协作
java·开发语言·git
德思特10 小时前
从 Dify 配置页理解 RAG 的重要参数
java·人工智能·llm·dify·rag
YOU OU11 小时前
Spring IoC&DI
java·数据库·spring
один but you11 小时前
从可变参数到 emplace:现代 C++ 性能优化的核心组合
java·开发语言
IT_陈寒11 小时前
Redis缓存击穿把我整不会了,原来还有这手操作
前端·人工智能·后端