在python中使用正则表达式

正则表达式是什么?就是要寻找的数据的规律,使用正则表达式的步骤有三

第一,寻找规律,第二使用正则符号表示规律,第三,提取信息

看下面的代码

python 复制代码
import re
wenzhang = ('小草偷偷地从土里钻出来,嫩嫩的,绿绿的。园子里,田野里,瞧去,密码是:200073215,一大片一大片满是的。'
            '坐着,躺着,打两个滚,踢几脚球,赛几趟跑:27329915,一,捉几回迷藏。风轻悄悄的,草软绵绵的。')
paqumima= re.findall(':(.*),',wenzhang)
paquzhunque = re.findall(':(.*?),',wenzhang)
print(paqumima,len(paqumima))
print(paquzhunque,len(paquzhunque))

输出效果为

python 复制代码
['200073215,一大片一大片满是的。坐着,躺着,打两个滚,踢几脚球,赛几趟跑:27329915,一,捉几回迷藏。风轻悄悄的'] 1
['200073215', '27329915'] 2

相关知识:

第一行 import re

python中正则表达式的模块就是re,所以第一行先导入模块re

第二行:wenzhang=('巴拉巴拉巴巴拉拉')

就是把要提取的文本源文件赋值给一个叫wenzhang的变量,当然这个变量名可以自己随便起。

第三行:paqumima= re.findall(':(.*),',wenzhang)

re是导入的模块,

点,findall是re模块中的一个方法,findall的使用格式是

re.findall('正则表达式',这是里源文本变量)

'正则表达式'的格式是

'要爬取文字前面的字符(.*)要爬取文字后面的字符'

返回的值就是按正则表达式描述的内容。

这里的正则表达式是**':(.*),'**

意思就是,从源文本中找以**:开头的,以,结尾的部分,这一部分就是用(.*)**表示

其中.表示除换行符以外的任何一个字符。

*表示它前面的一个表达式0次到无限次。

但是第三行的正则表达式有个缺点就是以:开头,以最后一个,结尾,中间还爬取了好多没用的信息,所以我们用了第四行的正则表达式

第四行代码:paquzhunque = re.findall(':(.*?),',wenzhang)

除了正则表达式多了一个?外,和第三行代码一模一样,从后面输出的效果来看

正则表达式(.*?)表示每一个符合正则表达式的内容。所以后面输出的效果长度也是2,也仅仅是输出了表示密码的部分。

相关推荐
No0d1es2 分钟前
第15届蓝桥杯Pthon青少组_国赛_中/高级组_2024年9月7日真题
python·青少年编程·蓝桥杯·国赛·中高组
啊森要自信32 分钟前
【MySQL 数据库】MySQL索引特性(二)页目录&&(B和B+树)&&(非)聚簇索引 && 索引操作
android·数据库·sql·mysql·adb·数据库架构
talented_pure1 小时前
Python打卡Day30 模块和库的导入
开发语言·python
大虫小呓1 小时前
Python So Easy 大虫小呓三部曲 - 高阶篇
python
王大傻09281 小时前
python匿名函数lambda
python
FJW0208142 小时前
Mysql集成技术
linux·mysql·云原生
Ashlee_code2 小时前
关税战火中的技术方舟:新西兰证券交易所的破局之道 ——从15%关税冲击到跨塔斯曼结算联盟,解码下一代交易基础设施
java·python·算法·金融·架构·系统架构·区块链
qq_316837752 小时前
String boot 接入 azure云TTS
python·flask·azure
蓝倾9762 小时前
电商API接口的优势、数据采集方法及功能说明
开发语言·python·api·开放api·电商开放平台
倔强青铜三2 小时前
GIL竟是Python命中注定的解药?统治AI时代的核心秘密!
人工智能·python·ai编程