爬虫-正则使用

1.模块选择

用re模块导入,,最前面加个r,就不用怕转义了

2.模块使用

re.findall

使用

结果是数组方式呈现

re.finditer

把结果变成迭代器,从迭代器类中间取数

re.search

re.search 只能匹配到第一个识别到的内容

re.match

3.推荐写法

先预加载完,就不用每次加载了,节省内存,用obj.引用

分组命名找数据,将id分为一类 ?P<xxxx>