统计 Python 字符串中每个单词出现的频率

目录:

本文中,需要编写一个 Python 程序,该程序将接受一个字符串作为输入并计算其中每个单词的出现次数。我们可以用多种方法来解决这个问题。

使用列表计算词频

使用列表来计算字符串中每个单词的出现次数:

将字符串转换为列表 input_string_list。

初始化一个空的列表 unique_string_list。

将字符串列表中的唯一值添加到空列表 unique_string_list。

使用循环迭代列表 unique_string_list 的元素,使用 count() 函数计算元素在列表 input_string_list 中出现的次数。

python 复制代码
# 测试字符串
input_string ='python  javascript java python javascript python java'
print("字符串:", input_string)
# 字符串转列表
input_string_list = input_string.split()     
print("字符串列表:", input_string_list)
unique_string_list = [] 
# iterate the input string list and find unique words 
for i in input_string_list:         
    if i not in unique_string_list: 
        unique_string_list.append(i) 
print("唯一字符串列表:", unique_string_list)
for i in range(0, len(unique_string_list)):
    # 统计输出单词数量
    print('词频[{}]: {}'.format(unique_string_list[i], input_string_list.count(unique_string_list[i])))

运行结果:

python 复制代码
字符串: python  javascript java python javascript python java
字符串列表: ['python', 'javascript', 'java', 'python', 'javascript', 'python', 'java']
唯一字符串列表: ['python', 'javascript', 'java']
词频[python]: 3
词频[javascript]: 2
词频[java]: 2

使用集合计算词频

使用集合来计算字符串中每个单词的出现次数:

同将字符串转换为列表 input_string_list。

将列表转换为集合删除重复项。

使用循环迭代集合的元素,使用 count() 函数计算元素在列表 input_string_list 中出现的次数。

python 复制代码
# 测试字符串
input_string ='python  javascript java python javascript python java'
print("字符串:", input_string)
# 字符串转列表
input_string_list = input_string.split()
print("字符串列表:", input_string_list)
# 列表转集合
unique_string_set = set(input_string_list) 
print("字符串集合:", unique_string_set)
for i in unique_string_set:
    print('词频[{}]: {}'.format(i, input_string_list.count(i)))

运行结果:

python 复制代码
字符串: python  javascript java python javascript python java
字符串列表: ['python', 'javascript', 'java', 'python', 'javascript', 'python', 'java']
字符串集合: {'java', 'javascript', 'python'}
词频[java]: 2
词频[javascript]: 2
词频[python]: 3
相关推荐
暴躁小师兄数据学院10 小时前
【AI大模型应用开发工程师特训笔记】第04讲(第9章):文件目录操作
人工智能·笔记·python
星梦清河10 小时前
Java—异步编程
java·开发语言
接着奏乐接着舞10 小时前
dto 转entity方法
java·开发语言
0x000710 小时前
译 Anders Hejlsberg 谈 C# 与 .NET
开发语言·c#·.net
TechWayfarer10 小时前
IP精准定位服务在快递网点规划中的应用:如何用客户位置数据辅助选址
大数据·网络·python·tcp/ip·交通物流
czhaii10 小时前
基于51单片机的Modbus从机通信系统
开发语言·单片机
elseif12310 小时前
【C++】vector 详细版
开发语言·c++·算法
codingPower11 小时前
JAVA后端安全进阶:基于HMAC-SHA256+Nonce+Timestamp的API防重放攻击方案
java·开发语言·spring boot·安全
暗冰ཏོ11 小时前
Go 语言从入门到后端项目实战完整指南
开发语言·后端·golang·go·go语言
CSND74011 小时前
零基础学Python合集---3:字符串的定义和常用方法
人工智能·python