python规则表达式re模块:笔记0529

Python语言使用printf printf:https://blog.51cto.com/u_16099181/7758801

使用python进行自动化运维脚本编写时经常需要处理远程设备返回到控制字符,比如下面这个例子,控制字符在使用print进行调试输出时因为是非ascii字符不显示,但却是实际存在的。调试时容易忽略,总是很困惑无法对远程设备返回的字符串进行精确匹配。

>>> test="\x1b[?2004hroot"

>>> print(test)
root

>>> alist=test, "control string"

>>> print(alist)

'\\x1b\[?2004hroot', 'control string'

>>> prompt=re.sub(r"\x1b\[\?2004h","", test)

>>> alist=prompt,"control string"

>>> print(alist)

'root', 'control string'

>>> prompt=re.sub("\\x1b\[\?2004h","", test)

>>> alist=prompt,"control string"

>>> print(alist)

'root', 'control string'

>>> prompt=re.sub("\\x1b\[\?2004hro","", test)

>>> print(alist)

'root', 'control string'

>>> alist=prompt,"control string"

>>> print(alist)

'ot', 'control string'

>>>

r字符串前缀的作用是消除转义字符的特殊含义,使字符串中的每个字符都按照字面意义进行解释。这在处理包含大量反斜杠、制表符、换行符等特殊字符的字符串时非常有用。

r字符串前缀将反斜杠字符视为普通字符,而不是转义字符。这样可以避免由于转义字符造成的错误或混淆。

字符串前缀r" "的区别:

>>> print(re.sub(r"\\\\x1b\\\[\\?2004hro","", test), 'control string')

'\\x1b\[?2004hroot', 'control string'

>>> print(re.sub("\\\\x1b\\\[\\?2004hro","", test), 'control string')

'ot', 'control string'

>>> print(re.sub(r"\\x1b\\\[\\?2004hro","", test), 'control string')

'ot', 'control string'

>>>

在正则表达式中,某些字符具有特殊含义,例如点号(.)、星号(*)、加号(+)等。如果要匹配这些特殊字符本身,而不是它们的特殊含义,可以使用r字符串前缀

>>> print(re.sub(r"\\x1b\[?2004hro","", test), 'control string') #出错,特殊字符[必须成对出现

>>> print(re.sub(r"\\x1b\\\[?2004hro","", test), 'control string') #匹配失败

'\\x1b\[?2004hroot', 'control string'

>>> print(re.sub(r"\\x1b\\\[\\?2004hro","", test), 'control string')

'ot', 'control string'

>>> print(re.sub(r"\\x1b\\\[?2004hro","", test), 'control string') #匹配失败,原字符?代表任何单一字符,在r字符串里面代表实际的普通字符?,这是模式字符串不是控制字符串而是一个实际的字符?,显然无法匹配上原始控制字符串。

'\\x1b\[?2004hroot', 'control string'

>>> print(re.sub("\\x1b\\\[\\?2004hro","", test), 'control string')

'ot', 'control string'

>>> print(re.sub(r"\\x1b\\\[\\?2004hro","", test), 'control string')

'ot', 'control string'

上面的例子中\x作为转义字符表示16进制,\[\?是将规则表达式中的特殊字符[和?作为普通字符处理。使用r字符串前缀时必须仍然加上\字符进行转义。与是否使用r前缀没有区别。

这里的\x1b\[\?和下面几个规则表达式的原字符有很大区别:点号(.)、星号(*)、加号(+)

>>> pattern = r'a-zA-Z0-9_.+-+@a-zA-Z0-9-+\.a-zA-Z0-9-.+'

>>> print(re.sub(pattern, '', email))

This is the email address: <<<

相同的是原字符点号(.)作为一个字符进行匹配时同样使用了\.

相关推荐
程序员小远5 分钟前
自动化测试基础知识总结
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
志栋智能17 分钟前
超自动化巡检:如何选择适合你的起点?
运维·自动化
HackTwoHub21 分钟前
Sqli-Scanner SQL注入SKILL自动化挖掘SQL注入,零依赖自动化SQL注入挖掘,赏金猎人
数据库·人工智能·sql·web安全·网络安全·自动化·系统安全
GEO优化小助手25 分钟前
2026临沂GEO优化公司实测解析:3家本土机构适配性参考
大数据·人工智能·python
砚底藏山河43 分钟前
沪深A股:如何获取基金持股数据
java·python·数据分析·maven
.千余43 分钟前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.1 小时前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
goldenrolan1 小时前
学习型红外控制系统稳定性挂测工装专项总结
软件测试·python·stm32·嵌入式·红外
小小龙学IT1 小时前
Apache Airflow 2.x 深度指南:用 Python 编排一切的现代化工作流引擎
开发语言·python·apache
csdndeyeye1 小时前
拆解AI投简历插件:塔塔网申的技术逻辑和实测数据
人工智能·自动化·秋招·ai投简历插件·ai找工作·求职助手·应届生就业