【Matlab笔记_15】正则表达式之特殊字符文本位置提取

目标:

  • 1.提取"BLT-1-A1.txt "中第一个'-'前面的所有字符。
  • 2.提取"BLT-1-A1.txt "中第一个'- '和第二个'-'中间的所有字符。
  • 3.提取"BLT-1-A1.txt "中最后一个'- '和最后一个'.'中间的所有字符。

方法如下:

1.提取"BLT-1-A1.txt "中第一个'-'前面的所有字符。

file_name ='BLT-1-A1.txt';
type = regexp(file_name, '^[^-]+', 'match');

注:

这个正则表达式的含义是匹配从字符串开始(^)到第一个连字符(-)之前的所有字符。这样,它会提取第一个连字符前面的内容。

请注意,这里使用的是 ^ [^-]+,其中:

^:表示匹配字符串的开始。

[ ^ - ]:表示除了连字符(-)以外的任何字符。

+:表示匹配前面的字符一个或多个。

这个正则表达式会匹配字符串开头的所有非连字符字符,直到遇到第一个连字符为止。

2.提取"BLT-1-A1.txt "中第一个'- '和第二个'-'中间的所有字符。

file_name ='BLT-1-A1.txt';
type = regexp(file_name, '(?<=-)\w+(?=-)', 'match');

(?<=-): 这是一个正向后顾界定。它表示在匹配的内容之前必须有一个连字符(-)。这个部分不会包含在最终匹配结果中。

\w+: 这是一个匹配一个或多个单词字符的正则表达式。\w 表示任何字母、数字或下划线字符,而 + 表示匹配前面的字符一个或多个。

(?=-): 这是一个正向前瞻界定。它表示在匹配的内容之后必须有一个连字符(-)。这个部分不会包含在最终匹配结果中。

'match': 这是 regexp 函数的选项,表示返回与整个正则表达式匹配的字符串。

综合起来,这个正则表达式的目标是匹配文件名中两个连字符(-)之间的单词,并将这个匹配结果存储在变量 type 中。

但是若是文件用有多个-,如'BLT-1-BKGD-A1.txt';,只要第一个和第二个'-'之间的可以如下处理:

file_name ='BLT-1-BKGD-A1.txt';
type = regexp(file_name, '(?<=-)\w+(?=-.*-)', 'match');

这里修改了正则表达式模式:

(?<=-): 仍然是正回顾后界定,表示匹配的内容必须位于一个连字符(-)的后面。

\w+: 仍然是匹配一个或多个单词字符(字母、数字或下划线)的部分。

(?=-.-): 新增的部分,这是一个正前瞻后界定,表示匹配的内容必须位于第一个连字符(-)后,并且在该连字符后面存在至少一个任意字符(. ),然后紧跟着第二个连字符。

这样,整个正则表达式将匹配第一个和第二个连字符之间的内容。

这里使用 .* 来表示匹配任意字符(除了换行符)。如果想要限定为非连字符的字符,可以使用 [^-],其中 [^-] 表示匹配除了连字符以外的任意字符, 表示匹配零个或多个。

3.提取"BLT-1-A1.txt "中最后一个'- '和最后一个'.'中间的所有字符。

file_name ='BLT-1-A1.txt';
type = regexp(file_name, '[-](\w+)\.', 'tokens', 'once');

'[-]': 这是匹配一个连字符(-)的部分。

(\w+): 这是匹配一个或多个单词字符(字母、数字或下划线)的部分,并使用圆括号将匹配的内容分组。这表示我们对这一部分感兴趣,后续可以通过结果访问。

.: 这是匹配一个点号(.)的部分。由于点号在正则表达式中有特殊含义(匹配任意字符),因此在这里我们使用反斜杠进行转义,表示匹配实际的点号。

'tokens': 这是 regexp 函数的一个选项,用于指定返回的结果形式。在这里,我们使用 'tokens',表示返回匹配项的令牌,也就是正则表达式中用括号分组的部分。

'once': 这是 regexp 函数的另一个选项,表示只返回第一个匹配的结果。因为你可能有多个匹配项,但我们只对第一个感兴趣。

因此,整个代码的作用是从文件名中提取一个连字符后、点号前的单词,并将结果存储在 type变量中。如果没有匹配到符合正则表达式的内容,type将是一个空数组。如果匹配到内容,type 将是一个包含一个单元素的单元格数组,其中包含了匹配的单词。

相关推荐
Purple Coder27 分钟前
第6章 图论
笔记
IT猿手1 小时前
最新高性能多目标优化算法:多目标麋鹿优化算法(MOEHO)求解GLSMOP1-GLSMOP9及工程应用---盘式制动器设计,提供完整MATLAB代码
开发语言·算法·机器学习·matlab·强化学习
Java编程乐园1 小时前
Java中以某字符串开头且忽略大小写字母如何实现【正则表达式(Regex)】
java·正则表达式
胡西风_foxww2 小时前
【ES6复习笔记】数值扩展(16)
前端·笔记·es6·扩展·数值
Somnus陳2 小时前
软考架构师笔记-计算机系统组成-1
笔记·系统架构
LuH11244 小时前
【论文阅读笔记】IC-Light
论文阅读·笔记
是小菜呀!4 小时前
实验四 触发器
笔记
悲伤小伞4 小时前
C++_数据结构_详解二叉搜索树
c语言·数据结构·c++·笔记·算法
好学近乎知o4 小时前
正则表达式(学习Django过程中可能涉及的)
学习·正则表达式·django
灰太狼不爱写代码7 小时前
CUDA11.4版本的Pytorch下载
人工智能·pytorch·笔记·python·学习