Python：正则表达式之re.group()用法

Python正则表达式之re.group()用法学习笔记

正则表达式是在处理字符串时非常有用的工具，而re.group()是在匹配到的文本中提取特定分组内容的方法之一。

1. re.group()的基本用法

在正则表达式中，通过圆括号可以创建一个或多个分组。re.group()用于获取匹配到的文本中的指定分组内容。

clike 复制代码

import re

# 示例正则表达式：提取日期中的年、月、日
pattern = r'(\d{4})-(\d{2})-(\d{2})'
date_string = '2022-01-15'

match = re.match(pattern, date_string)

if match:
    # 使用group()获取整个匹配的内容
    print("整个匹配的内容:", match.group())
    
    # 使用group(1)、group(2)、group(3)获取各个分组的内容
    print("年:", match.group(1))
    print("月:", match.group(2))
    print("日:", match.group(3))
else:
    print("未匹配到日期格式")

输出结果:

clike 复制代码

整个匹配的内容: 2022-01-15
年: 2022
月: 01
日: 15

2. re.group()的区别

group(0)或group()：获取整个匹配的内容。
group(1)：获取第一个分组的内容。
group(2)：获取第二个分组的内容。

以此类推，可以使用group(n)来获取第n个分组的内容。

3. 举例说明

clike 复制代码

import re

# 示例正则表达式：匹配电子邮件地址，并提取用户名和域名
pattern = r'(\w+)@(\w+\.\w+)'
email = 'user@example.com'

match = re.match(pattern, email)

if match:
    # 使用group()获取整个匹配的内容
    print("整个匹配的内容:", match.group())
    
    # 使用group(1)、group(2)获取用户名和域名
    print("用户名:", match.group(1))
    print("域名:", match.group(2))
else:
    print("未匹配到电子邮件地址")

输出结果:

clike 复制代码

整个匹配的内容: user@example.com
用户名: user
域名: example.com

4. re.match()和re.search()的主要区别在于匹配的位置。

re.match():

re.match()**只匹配字符串的开头，**如果字符串开头不满足正则表达式，就不会匹配成功。
如果正则表达式匹配成功，match对象将被返回，否则返回None。

clike 复制代码

import re

pattern = r'\d+'
text = '123abc'

match_result = re.match(pattern, text)

if match_result:
    print("Match found:", match_result.group())
else:
    print("No match")

输出结果:

clike 复制代码

Match found: 123

re.search():

re.search()会在整个字符串中搜索第一个匹配项，而不仅仅是字符串的开头。
如果在字符串中找到匹配项，同样返回match对象，否则返回None。

clike 复制代码

import re

pattern = r'\d+'
text = 'abc123def'

search_result = re.search(pattern, text)

if search_result:
    print("Match found:", search_result.group())
else:
    print("No match")

输出结果:

clike 复制代码

Match found: 123

总结：

使用re.match()时，正则表达式要从字符串的开头开始匹配。
使用re.search()时，正则表达式可以在字符串的任意位置匹配，但只返回第一个匹配项。
选择使用哪个函数取决于你想要匹配的字符串位置。如果你希望从字符串开头进行匹配，使用re.match()；如果你只关心字符串中的任意位置是否有匹配项，使用re.search()。