这里每天分享一个 iOS 的新知识,快来关注我吧
前言
前面介绍了一些关于正则表达式的常规用法,其实在 WWDC 2022 上,swift 5.7 中带来了字符串匹配相关的重大升级,其中就包括正则方面的新功能,今天就来讲讲。
Regex
Regex 类型是 iOS 16 新出的一个类型,利用这个类型,你可以很轻易地生成正则表达式:
java
let pattern = #"(\d+)"#
let regex = try Regex(pattern)
这种创建方式和 NSRegularExpression
差不多,首先,你还是需要将特殊符号用反斜杠标记,其次,你需要使用 try 来捕获异常情况。
为了避免上述情况,swift 出了一种使用两个斜杠"/.../"来直接生成 Regex
的方法,以上代码等同于:
javascript
let regex1 = /(\d+)/
这种通过正则语法糖的方式生成正则表达式时,可以在编译器检查是否有语法错误,还有 Xcode 语法突出显示。
使用这个表达式可以检测字符串中的名称和数字:
scss
let regex = /(\w+)\s+(\d+)/
let input = "Tom 123 xyz"
if let result = input.firstMatch(of: regex) {
print(result.0) // Tom 123
print(result.1) // Tom
print(result.2) // 123
}
输出的结果是一个元组,第一个值正则表达式匹配的所有内容,第二个值是捕获的第一个子字符串,第三个值是捕获的第二个子字符串,以此类推。
也可以用元组命名每个属性的名字:
scss
let regex = /(\w+)\s+(\d+)/
let input = "Tom 123 xyz"
if let (matched, name, count) = input.firstMatch(of: regex)?.output {
print(matched) // Tom 123
print(name) // Tom
print(count) // 123
}
我们还可以在正则表达式里直接命名捕获的变量:
javascript
let input = "Tom 123 xyz"
let regex = /(?<name>\w+)\s+(?<count>\d+)/
if let match = input.firstMatch(of: regex) {
print(match.name) // Tom
print(match.count) // 123
}
不同的匹配方式
swift 提供了几种不同的方法,可以用来匹配正则表达式:
javascript
// 首个匹配
input.firstMatch(of: regex)
// 完整匹配
input.wholeMatch(of: regex)
// 前缀匹配
input.prefixMatch(of: regex)
let line = "Tom 1234"
// 将空格替换成逗号
let line1 = line.replacing(/\s+/,with:",") // Tom,1234
// 去除字母和空格
let line2 = line.trimmingPrefix(/\w+\s+/) // 1234
// 使用空格拆分
let fields = line.split(separator: /\s+/) // ["Tom","1234"]
正则表达式生成器
除此之外,swift 还提供了正则表达式构建器 DSL,可以以更结构化,可读性更高的方法来构建你想要的正则表达式。
首先导入 RegexBuilder 模块:
arduino
import RegexBuilder
然后构建正则表达式:
javascript
let regex = Regex {
Capture {
OneOrMore(.word) // 一个或多个单词
}
OneOrMore(.whitespace) // 一个或多个空格
Capture {
OneOrMore(.digit) // 一个或多个数字
}
}
let input = "Tom 123 xyz"
if let match = input.firstMatch(of: regex) {
let name = match.1 // Tom
let count = match.2 // 123
}
以前的正则表达式语法非常难以记忆,有了这套 DSL 构建器之后,正则将会简单很多,除了上边用到的 OneOrMore
之外,还有很多可用的语法表达式,以下是一些常用的:
-
One 精确匹配出现一次
-
OneOrMore 匹配出现一次或多次
-
ZeroOrMore 匹配出现零次或一次
-
Lookahead 仅当其内容在给定位置匹配时才允许匹配继续
-
NegativeLookahead 仅当其内容在给定位置不匹配时才允许继续匹配
-
Repeat 指定次数的匹配
其中可输入的常用参数有:
-
.any 与任何元素匹配的字符类
-
.anyNonNewline 与任何非换行符元素匹配的字符类
-
.digit 任意数字
-
.hexDigit 任何十六进制数字
-
.word 任何单词字符
-
.whitespace 任何空格字符
其他内容大家可以自行探索一下。
这里每天分享一个 iOS 的新知识,快来关注我吧
本文同步自微信公众号 "iOS新知",每天准时分享一个新知识,这里只是同步,想要及时学到就来关注我吧!