如何从串 ‘ 中国 +86‘ 中,获取到‘中国’:strip()、split()及正则表达式的使用

业务中有这样一个场景,国家列表中的数据格式是这样: ' 中国 +86' ,其中的 "中国" 前面有3个空格,需要从中提取出 "中国",有哪些方法呢?

方法 1:使用 strip() 和 split()

strip() 方法可以去掉字符串前后的空白字符(包括空格、换行符等),然后可以使用 split() 来分割字符串。

python 复制代码
s = '   中国  +86'
country = s.strip().split()[0]  # 去除前后的空格,再分割并获取第一个部分
print(country)

说明:

strip() 去除字符串前后所有的空白字符(包括空格)。

split() 默认按空格分割字符串,返回一个列表,split()[0] 获取第一个部分,即 "中国"。

方法 2:使用正则表达式

正则表达式可以灵活地匹配字符串中的目标部分,无论前面是否有空格。

python 复制代码
import re

s = '   中国  +86'
match = re.match(r'^\s*([\u4e00-\u9fa5]+)', s)  # 匹配字符串开始的空格并提取中文部分
if match:
    country = match.group(1)
    print(country)

说明:

正则表达式 r'^\s*([\u4e00-\u9fa5]+)' 解释:

^\s* 匹配字符串开始部分的零个或多个空格。

([\u4e00-\u9fa5]+) 匹配连续的中文字符,并将其提取出来。

group(1) 获取第一个括号中匹配的内容,即 "中国"。

【总结】

方法 1:如果你的字符串只是简单的有空格,并且不需要特别复杂的匹配,strip() 和 split() 方法已经足够。

方法 2:如果字符串格式更复杂,或者你希望通过更灵活的方式匹配特定字符,正则表达式是更强大的选择。

相关推荐
林泽毅1 分钟前
SwanLab硬件监控:英伟达、昇腾、寒武纪
python·深度学习·昇腾·英伟达·swanlab·寒武纪·训练实战
小哲慢慢来1 小时前
解决auto_gptq安装问题
python
奔跑草-1 小时前
【服务端】使用conda虚拟环境部署Django项目
python·django·conda
ai大师1 小时前
给聊天机器人装“短期记忆“:Flask版实现指南
后端·python·gpt·flask·oneapi·中转api·apikey
moz与京5 小时前
[附C++,JS,Python题解] Leetcode 面试150题(10)——轮转数组
c++·python·leetcode
什码情况6 小时前
回文时间 - 携程机试真题题解
数据结构·python·算法·华为od·机试
Alfadi联盟 萧瑶6 小时前
Python-Django入手
开发语言·python·django
漠北尘-Gavin7 小时前
【Python3.12.9安装llama-cpp-python遇到编译报错问题解决】
python·llama
测试老哥8 小时前
什么是集成测试?集成的方法有哪些?
自动化测试·软件测试·python·测试工具·职场和发展·单元测试·集成测试