正则表达式

运用正则表达式进行爬虫

就是把想要得到的信息爬取出来

贪婪爬取和非贪婪爬取

replace(正则表达式, 新的内容) 符合正则表达式的被替换成新的内容(返回值是String)

split(正则表达式) 按照正则表达式规则切割字符串(返回值是String[]), 遍历数组就可以得到了

分组

其实就是把内容分组, 然后用组号代替内容复制,这样就不用多写几遍

练习:

其实正则表达式不用背, 以后要用的时候直接右键选择插件下载的选择"AnyRule", 或者直接ai生成就好了

相关推荐
Mr.Rice.Fool10 小时前
rust面试经验1
后端·面试·职场和发展·rust
xun-ming10 小时前
AI时代Java程序员自救手册
java·开发语言·人工智能
DavidSoCool10 小时前
GB28181 PTZCmd 完整指令对照表(8 位 16 进制)+ 详细注释 + 使用说明
java·sip·gb28181
张健115640964810 小时前
C++访问控制与友元
java·开发语言·c++
Sam_Deep_Thinking10 小时前
中小团队需要一个资源微服务
java·微服务·架构
Thanks_ks11 小时前
透过 Copy-On-Write 机制:理解并发编程中的性能与一致性权衡
java·多线程·并发编程·底层原理·写时复制·copyonwrite·性能优
一只幸运猫.11 小时前
JAVA后端面试题
java·开发语言
空中海11 小时前
第三章:Maven高级篇 — 插件开发与多模块工程
java·maven
秋911 小时前
TiDB 数据库全链路实战指南:从下载部署到 Java 高并发调优
java·数据库·tidb
JAVA面经实录91711 小时前
Java开发工程基础完整手册(企业实战完整版)
java·开发语言·git·ci/cd·svn·github·intellij idea