用Python字典简单实现词频统计

1 问题

在生活中我们偶尔会碰到一个任务要求:需要统计一本小说中某个人的名字,或者某个关键词在文章中出现的次数,由于字数太多我们不可能人为的慢慢去计数,这时我们可以根据程序来自动获得其次数。

2 方法

根据字典的性质,以此关键词或人名作为字典的键,出现次数作为其字典的值。首先对文中进行分词,对每个词建立键,以此遍历每个词。如果字典中有该词,则其值+1否则设为1并创建该词的键。

代码清单 1

|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() word_frequence={} for word in words: if word in word_frequence.keys(): #判断当前访问的单词是否在字典中 word_frequence[word] += 1 #如果存在,则将该单词对应键的值加一 else: word_frequence[word] = 1 #如果不存在则创建键,并赋值为一 print(word_frequence) #get()实现 forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() word_frequence={} for i in range(len(words)): word_frequence[words[i]] = word_frequence.get(words[i],0) + 1 #get()方法 如果取不到则为0; print(word_frequence) #内置库 from collections import Counter forexamle="You are you are,you are the trouble I'm in" forexample = forexamle.lower() words = forexample.split() print(dict(Counter(words))) |

3 结语

针对如何用python实现简单词频统计的问题,提出上述几个方面的知识和操作,通过亲自实验,证明该方法是有效的,本文使用这种方法解决了统计一本小说中某个人的名字,或者某个关键词在文章中出现的次数等问题,但方法并不简便,还有考虑不周的地方,未来可以继续研究更加简洁方便的代码进行处理。

相关推荐
HenryLin7 分钟前
美股量化分析系统 - 模块调用流程文档
python
跟橙姐学代码9 分钟前
一文读懂 Python 的 JSON 模块:从零到高手的进阶之路
前端·python
躺不平的小刘24 分钟前
从YOLOv5到RKNN:零冲突转换YOLOv5模型至RK3588 NPU全指南
linux·python·嵌入式硬件·yolo·conda·pyqt·pip
文火冰糖的硅基工坊1 小时前
[激光原理与应用-317]:光学设计 - Solidworks - 草图
开发语言·python·信息可视化·系统架构
草莓熊Lotso1 小时前
【C语言强化训练16天】--从基础到进阶的蜕变之旅:Day10
c语言·开发语言·经验分享·算法·强化
草明1 小时前
docker stats 增加一列容器名称的显示
java·开发语言·docker
高级测试工程师欧阳1 小时前
python中selenium怎么使用
python·pandas
BertieHuang2 小时前
(一)深入源码,从 0 到 1 实现 Cursor
人工智能·python·程序员
He1955012 小时前
Go初级二
开发语言·后端·golang
以泪为证2 小时前
WebSocket 任务分发系统代码深度分析与应用
python