在VB.net中,用正则表达式方法清除干扰符号方法

==标题==

|---------------------------|
| 在VB.net中,用正则表达式方法清除干扰符号方法 |

==正文==

上一篇提到通常的word文档复制、粘贴的干扰符号有:chr(7)、chr(11)、chr(13)、chr(9)、chr(160)

在VBA中,提取word表格的文本时,通常有什么干扰符号,需要清除

今天来设计一个函数来清洗它们

一、在VB.NET中使用正则表达式清除Word表格文本中的干扰符号(如Chr(7)Chr(13)Chr(11)),可通过以下方法实现:

apache 复制代码
Imports System.Text.RegularExpressionsFunction CleanTableText(inputText As String) As String    Dim pattern As String = "[\x07\x0B\x0D]"  ' 匹配Chr(7), Chr(11), Chr(13)    Return Regex.Replace(inputText, pattern, String.Empty)End Function

代码说明

  1. 正则模式[\x07\x0B\x0D] 使用十六进制表示法匹配:
  • \x07Chr(7)(单元格结束符)
  • \x0BChr(11)(垂直制表符)
  • \x0DChr(13)(段落标记)
  1. 替换逻辑Regex.Replace 将匹配项替换为空字符串,实现批量清除

以上的函数只清洗3个符号,我们还有chr(9)、chr(160)

二、清洗5个干扰符号的增强版本

sql 复制代码
' 增强版:同时处理不间断空格(Chr(160))和制表符(Chr(9))Function AdvancedClean(inputText As String) As String    Dim pattern As String = "[\x07\x0B\x0D]|[\xA0]|\t"    Dim cleaned = Regex.Replace(inputText, pattern, Function(m)         Return If(m.Value = Chr(160), " ", "") ' 不间断空格转普通空格    End Function)    Return cleanedEnd Function

能亮点

  1. 使用 |运算符扩展匹配范围
  1. 通过替换函数区分处理:
  • 不间断空格(C``hr(160)) → 转为普通空格
  • 其他干扰符 → 直接删除
  1. \``t显式匹配制表符(C``hr(9))

三、使用示例:

javascript 复制代码
Dim rawText As String = "单元格内容" & Chr(7) & "结尾" & Chr(11) & "多行" & Chr(13) & "文本"Dim cleanText As String = CleanTableText(rawText)' 输出结果: "单元格内容结尾多行文本"

四、关键注意事项

  1. 命名空间必需:确保已导入 System.Text.RegularExpressions

  2. Unicode处理:VB.NET正则默认支持Unicode字符(如中文)

==The end==

==合集==

====若有用,请转发免费学习====

ExcelVBA文章列表

关注看更多文章

相关推荐
CodeCraft Studio2 小时前
PDF处理控件Aspose.PDF教程:使用 Python 将 PDF 转换为 Base64
开发语言·python·pdf·base64·aspose·aspose.pdf
零点零一2 小时前
VS+QT的编程开发工作:关于QT VS tools的使用 qt的官方帮助
开发语言·qt
lingchen19065 小时前
MATLAB的数值计算(三)曲线拟合与插值
开发语言·matlab
gb42152875 小时前
java中将租户ID包装为JSQLParser的StringValue表达式对象,JSQLParser指的是?
java·开发语言·python
一朵梨花压海棠go5 小时前
html+js实现表格本地筛选
开发语言·javascript·html·ecmascript
蒋星熠5 小时前
Flutter跨平台工程实践与原理透视:从渲染引擎到高质产物
开发语言·python·算法·flutter·设计模式·性能优化·硬件工程
翻滚丷大头鱼6 小时前
Java 集合Collection—List
java·开发语言
aramae6 小时前
C++ -- 模板
开发语言·c++·笔记·其他
胡耀超6 小时前
4、Python面向对象编程与模块化设计
开发语言·python·ai·大模型·conda·anaconda
索迪迈科技7 小时前
java后端工程师进修ing(研一版 || day40)
java·开发语言·学习·算法