如何从串 ‘ 中国 +86‘ 中，获取到‘中国’：strip()、split()及正则表达式的使用

_可乐无糖2025-01-08 18:39

业务中有这样一个场景，国家列表中的数据格式是这样： ' 中国 +86' ，其中的 "中国" 前面有3个空格，需要从中提取出 "中国"，有哪些方法呢？

方法 1：使用 strip() 和 split()

strip() 方法可以去掉字符串前后的空白字符（包括空格、换行符等），然后可以使用 split() 来分割字符串。

python 复制代码

s = '   中国  +86'
country = s.strip().split()[0]  # 去除前后的空格，再分割并获取第一个部分
print(country)

说明：

strip() 去除字符串前后所有的空白字符（包括空格）。

split() 默认按空格分割字符串，返回一个列表，split() $0$ 获取第一个部分，即 "中国"。

方法 2：使用正则表达式

正则表达式可以灵活地匹配字符串中的目标部分，无论前面是否有空格。

python 复制代码

import re

s = '   中国  +86'
match = re.match(r'^\s*([\u4e00-\u9fa5]+)', s)  # 匹配字符串开始的空格并提取中文部分
if match:
    country = match.group(1)
    print(country)

说明：

正则表达式 r'^\s*( $\\u4e00-\\u9fa5$ +)' 解释：

^\s* 匹配字符串开始部分的零个或多个空格。

( $\\u4e00-\\u9fa5$ +) 匹配连续的中文字符，并将其提取出来。

group(1) 获取第一个括号中匹配的内容，即 "中国"。

【总结】

方法 1：如果你的字符串只是简单的有空格，并且不需要特别复杂的匹配，strip() 和 split() 方法已经足够。

方法 2：如果字符串格式更复杂，或者你希望通过更灵活的方式匹配特定字符，正则表达式是更强大的选择。