VBA之正则表达式(48)-- 快速拆分中文语句

实例需求:对于任意一段文字,按照中文标点符号拆分为数组,并在立即窗口输出。

例如对于如下内容:

本文为博主原创文章,未经博主允许不得转载。访问本人博客123,测试完成

VBE【立即窗口】中输出为:

本文为博主原创文章
未经博主允许不得转载
访问本人博客123
测试完成

示例代码如下:

vb 复制代码
Sub Demo()
    Dim objRegExp As Object, strTxt As String, aTxt, i As Long
    Set objRegExp = CreateObject("vbscript.regexp")
    objRegExp.Pattern = "[。?!,、;:「」『』''""()〔〕【】---...--.《》〈〉]"
    objRegExp.Global = True
    objRegExp.IgnoreCase = True
    objRegExp.MultiLine = False
    strTxt = "本文为博主原创文章,未经博主允许不得转载。访问本人博客123,测试完成"
    strTxt = objRegExp.Replace(strTxt, vbTab)
    aTxt = Split(strTxt, vbTab)
    For i = 0 To UBound(aTxt)
        Debug.Print aTxt(i)
    Next
End Sub

【代码解析】

第3行代码创建正则对象。

第4行代码设置匹配模式,此处只是包含了常用的中文标点符合,如果输入文本中使用了更多标点,请自行添加。

第5~7行代码设置正则匹配模式。

第8行代码为测试文本。

第9行代码是正则替换,将中文标点符号替换为Tab,如果输入文本中包含Tab字符,那么也可以使用其他分界符。

第19行代码使用分界符将替换的文档拆分为数组。

第11~13行代码循环遍历数组,并输出到【立即窗口】中。

相关推荐
疯狂吧小飞牛1 天前
正则表达式特殊字符
正则表达式
White graces1 天前
正则表达式效验邮箱格式, 手机号格式, 密码长度
前端·spring boot·spring·正则表达式·java-ee·maven·intellij-idea
astragin1 天前
正则表达式常用记录
正则表达式
不会玩技术的技术girl1 天前
使用Python和正则表达式爬取网页中的URL数据
开发语言·python·正则表达式
疯狂吧小飞牛1 天前
正则表达式–断言
正则表达式
yuanbenshidiaos1 天前
【正则表达式】
数据库·mysql·正则表达式
奔跑吧邓邓子2 天前
【Python爬虫(12)】正则表达式:Python爬虫的进阶利刃
爬虫·python·正则表达式·进阶·高级
阿华的代码王国2 天前
【从0做项目】Java搜索引擎(6)& 正则表达式鲨疯了&优化正文解析
java·后端·搜索引擎·正则表达式·java项目·从0到1做项目
程序员小王꧔ꦿ3 天前
BeautifulSoup、lxml/XPath和正则表达式在数据爬取中的核心差异及适用场景
正则表达式·beautifulsoup
程序员小王꧔ꦿ3 天前
BeautifulSoup、lxml/XPath和正则表达式在数据爬取中的适用场景
正则表达式·beautifulsoup