正则表达式试炼

我希望在这里列出我很多想写的正则表达式,很多我想写,但是不知道怎么写的。分享点滴案例。未来这个文章会越来越长

案例

我有这样的一批文字,我需要删掉Mozilla/5.0前面的所有内容,如果可以用正则表达式批量匹配到,删除就会很快。

Mac Chrome Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36

Mac Firefox Mozilla/5.0 (Macintosh; Intel Mac OS X 10.12; rv:65.0) Gecko/20100101 Firefox/65.0

Mac Safari Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.0.3 Safari/605.1.15

Windows Chrome Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36

Windows Edge Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763

Windows IE Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko

iOS Chrome Mozilla/5.0 (iPhone; CPU iPhone OS 7_0_4 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) CriOS/31.0.1650.18 Mobile/11B554a Safari/8536.25

iOS Safari Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1.4

Android Chrome Mozilla/5.0 (Linux; Android 4.2.1; M040 Build/JOP40D) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.59 Mobile Safari/537.36

Android Webkit Mozilla/5.0 (Linux; U; Android 4.4.4; zh-cn; M351 Build/KTU84P) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30

写法如下:

bash 复制代码
^(.*?)(?=Mozilla)

这个正则表达式的含义是:

  • ^:匹配行的开始。 (.*?):使用非贪婪模式匹配任何字符,尽可能少地匹配。这一部分将会是你的匹配结果。
  • (?=Mozilla):前瞻断言,查找后面是 "Mozilla" 的内容,但不包含 "Mozilla" 本身。
  • 这个正则表达式将会匹配每一行中 "Mozilla" 前面的所有内容,但不包含 "Mozilla" 本身。

可以看到,正确地匹配到了前面的内容

相关推荐
水木流年追梦9 小时前
大模型入门-大模型的推理策略
开发语言·python·算法·正则表达式·prompt
水木流年追梦12 小时前
大模型入门-DPO 直接偏好优化
人工智能·学习·算法·机器学习·正则表达式
asdfg125896315 小时前
使用正则表达式str.split(“\\W+“)拆分句子
java·正则表达式
我材不敲代码1 天前
Python 正则表达式进阶实战:从文本清洗到复杂信息提取
c++·python·正则表达式
水木流年追梦2 天前
大模型入门-Reward 奖励模型训练
开发语言·python·算法·leetcode·正则表达式
水木流年追梦3 天前
大模型入门-RL基础
开发语言·python·算法·leetcode·正则表达式
IT大白鼠4 天前
2019年Cloudflare全球宕机事件技术分析:正则表达式回溯失控与互联网基础设施脆弱性研究
运维·正则表达式·去中心化
XMYX-06 天前
33 - Go 文本模板 template:从入门到原理深挖
golang·正则表达式
XMYX-06 天前
32 - Go 正则表达式:从匹配字符串到理解 RE2 引擎
golang·正则表达式
程序员榴莲6 天前
Python 正则表达式入门:从匹配手机号到提取文本内容
python·正则表达式