单词统计详解---pyhton

有一个.txt的文本文件,对齐单词进行统计,并显示单词重复做多的10个单词

思路:

1将文本文件进行逐行处理,并进行空格分割处理

2新建一个字典,使用get方法将单词一次添加到字典中,并用sorted方法进行排序。

这里解释一下最后一句的意思,有些同学可能看不懂。

3统计path单词个数

但是path有很多其他符号,如何提取,只保留path单词呢?

方法1:

创建一个列表,使用replace将特俗符号换成空格,添加到列表中,不是的直接添加到列表中,使用split方法分割出空格

方法二使用正则表达式

方法三使用切片

def make_key(line: str):

line = line.lower()

chars = set("""~!@#$%^&*()_-+=|{}[]:;"'<>?/,.\n\r\t""")

ret = []

start=0

length=len(line)

for i,c in enumerate(line):

if c in chars:

if start==i:#说明连续两个字符是特殊字符,

start+=1

continue#跳过

ret.append(line[start:i])

start=i+1

else:

if start<length:

ret.append(line[start:])

return ret

line="b([a"#出现连续非法字符

#line="""os.path.commomprefix(['/usr/lib' split/replace sub'"""

print(*make_key(line))

完整代码

相关推荐
帅气的你5 分钟前
Spring Boot 集成 AOP 实现日志记录与接口权限校验
java·spring boot
学Linux的语莫11 分钟前
linux的root目录缓存清理
linux·运维·服务器
oMcLin13 分钟前
如何在 SUSE Linux Enterprise Server 15 上部署并优化 K3s 集群,提升轻量级容器化应用的资源利用率?
linux·运维·服务器
zhglhy24 分钟前
Spring Data Slice使用指南
java·spring
win x36 分钟前
Redis 主从复制
java·数据库·redis
周末吃鱼43 分钟前
MySQL CTE:SQL查询新模式
数据库·sql·mysql
Ghost Face...1 小时前
深入解析YT6801驱动模块架构
linux·运维·服务器
木风小助理1 小时前
解读 SQL 累加计算:从传统方法到窗口函数
大数据·数据库·sql
weixin_423995001 小时前
unity 处理图片:截图,下载,保存
java·unity·游戏引擎
帅气的你1 小时前
从零封装一个通用的 API 接口返回类:统一前后端交互格式
java·设计模式