用正则方法从中英文本提取英文的python示例

一、示例代码:

python 复制代码
import re                                     # 载入正则表达式模块

file = open('/home/lijiang/Excel人员数据/码农必会词汇表')
data = file.read()
file.close()

result = re.findall('[A-z]+', data)        # 用findall方法,找出data中所有从A-z的连续字符

result.sort()                                 # 把得到的结果字符串list排序,默认为字母顺序

data = '\n'.join(result)                      # 把排序后的结果用换行符连接成一段文本
print(data)

file2 = open('/home/lijiang/Excel人员数据/提取单词后.txt', 'w')
file2.write(data)
file2.close()

二、运行展示:

1、原文本文件:

2、运行结果:

相关推荐
阔皮大师1 小时前
INote轻量文本编辑器
java·javascript·python·c#
小法师爱分享1 小时前
StickyNotes,简单便签超实用
java·python
深蓝电商API1 小时前
处理字体反爬:woff字体文件解析实战
爬虫·python
开源技术1 小时前
Claude Opus 4.6 发布,100万上下文窗口,越贵越好用
人工智能·python
张3蜂1 小时前
深入理解 Python 的 frozenset:为什么要有“不可变集合”?
前端·python·spring
皮卡丘不断更1 小时前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”
人工智能·spring boot·python·ai编程
爱打代码的小林2 小时前
基于 MediaPipe 实现实时面部关键点检测
python·opencv·计算机视觉
极客小云2 小时前
【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】
网络·python·自动化·comfyui
闲人编程2 小时前
Elasticsearch搜索引擎集成指南
python·elasticsearch·搜索引擎·jenkins·索引·副本·分片
痴儿哈哈2 小时前
自动化机器学习(AutoML)库TPOT使用指南
jvm·数据库·python