用Python字典简单实现词频统计

1 问题

在生活中我们偶尔会碰到一个任务要求:需要统计一本小说中某个人的名字,或者某个关键词在文章中出现的次数,由于字数太多我们不可能人为的慢慢去计数,这时我们可以根据程序来自动获得其次数。

2 方法

根据字典的性质,以此关键词或人名作为字典的键,出现次数作为其字典的值。首先对文中进行分词,对每个词建立键,以此遍历每个词。如果字典中有该词,则其值+1否则设为1并创建该词的键。

代码清单 1

|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() word_frequence={} for word in words: if word in word_frequence.keys(): #判断当前访问的单词是否在字典中 word_frequenceword += 1 #如果存在,则将该单词对应键的值加一 else: word_frequenceword = 1 #如果不存在则创建键,并赋值为一 print(word_frequence) #get()实现 forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() word_frequence={} for i in range(len(words)): word_frequencewords\[i] = word_frequence.get(wordsi,0) + 1 #get()方法 如果取不到则为0; print(word_frequence) #内置库 from collections import Counter forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() print(dict(Counter(words))) |

3 结语

针对如何用python实现简单词频统计的问题,提出上述几个方面的知识和操作,通过亲自实验,证明该方法是有效的,本文使用这种方法解决了统计一本小说中某个人的名字,或者某个关键词在文章中出现的次数等问题,但方法并不简便,还有考虑不周的地方,未来可以继续研究更加简洁方便的代码进行处理。

相关推荐
2501_947575802 小时前
计算机毕业设计之jsp开山车行二手车交易系统
java·开发语言·hadoop·python·信息可视化·django·课程设计
骑士雄师3 小时前
java面试题 4:鉴权
java·开发语言
Byron__3 小时前
AI学习_06_短期记忆与长期记忆
人工智能·python·学习
时间的拾荒人4 小时前
C语言字符函数与字符串函数完全指南
c语言·开发语言
2501_948106914 小时前
计算机毕业设计之基于jsp教科研信息共享系统
java·开发语言·信息可视化·spark·课程设计
取经蜗牛4 小时前
Python 第一阶段完全指南:从零到第一个实用工具
开发语言·python
创世宇图4 小时前
【Python工程化实战】OpenTelemetry 在 Python 中的全链路追踪落地:从埋点到可视化的完整实战指南
python·分布式链路追踪·性能监控·opentelemetry·微服务可观测性
dog2505 小时前
从重尾到截断流量模型的演进
开发语言·php
qq_401700415 小时前
Qt QSS 完全入门写出漂亮界面以及解决样式不生效问题
开发语言·qt
许彰午6 小时前
72_Python爬虫基础BeautifulSoup
爬虫·python·beautifulsoup