wordcloud库基本介绍

文章目录

wordcloud库概述

wordcloud是优秀的词云展示第三方库

词云以词语为基本单位,更加直观和艺术地展示文本

wordcloud库的安装

(cmd命令行) pip install wordcloud

wordcloud库使用说明

wordcloud库把词云当作一个wordcloud对象

  • wordcloud.WordCloud() 代表一个文本对应的词云
  • 可以根据文本中词语出现的概率等参数绘制词云
  • 词云的绘制形状,尺寸和颜色都可以设定

wordcloud库常规方法

w = wordcloud.WordCloud()

  • 以WordCloud对象为基础
  • 配置参数,加载文件,输出文件
python 复制代码
import wordcloud
c = wordcloud.WordCloud() # 步骤1: 配置对象参数
c.generate("wordcloud by Python") # 步骤2: 加载词云文本
c.to_file("pywordcloud.png") # 步骤三: 输出词云文件


配置对象参数

w = wordcloud.WordCloud(<参数>)

参数 描述
width 指定词云对象生成图片的宽度,默认400像素 w=wordcloud.WordCloud(width=600)
height 指定词云对象生成图片的高度,默认200像素 w=wordcloud.WordCloud(height=400)


wordcloud应用实例

python 复制代码
import wordcloud
txt = "life is short,you need python"
w = wordcloud.WordCloud(background_color="purple")
w.generate(txt)
w.to_file("pywcloud.png")

以空格分隔单词

中文需要先分词并组成空格分隔字符串

python 复制代码
import wordcloud
import jieba
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,使计算机能够自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("py.jpg")

实例: 政府工作报告词云

问题分析: 直观了解政策文件

  • 需求: 对于政府工作报告等政策文件,如何直观理解?
  • 体会直观的价值: 生成词云 & 优化词云

政府工作报告等文件 ⇒ 有效展示的词云

这个案例我们使用的材料:材料

思路:

  1. 读取文件,分词整理
  2. 设置并输出词云
  3. 观察结果,优化迭代

代码:

python 复制代码
import jieba
import wordcloud
f = open("1.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path="msy.ttc",width=1000,height=700,background_color="white")
w.generate(txt)
w.to_file("wordcloud.jpg")

还有一些其他更丰富的词云就自己探索叭!

相关推荐
墨理学AI4 小时前
一文学会一点python数据分析-小白原地进阶(mysql 安装 - mysql - python 数据分析 - 学习阶段梳理)
python·mysql·数据分析
数研小生4 小时前
亚马逊商品列表API详解
前端·数据库·python·pandas
独好紫罗兰4 小时前
对python的再认识-基于数据结构进行-a005-元组-CRUD
开发语言·数据结构·python
jianghua0014 小时前
Python中的简单爬虫
爬虫·python·信息可视化
喵手4 小时前
Python爬虫实战:针对Python官网,精准提取出每一个历史版本的版本号、发布日期以及对应的文档/详情页链接等信息,并最终清洗为标准化的CSV文件!
爬虫·python·爬虫实战·零基础python爬虫教学·python官方数据采集·采集历史版本版本号等信息·导出csv文件
databook4 小时前
像搭积木一样思考:数据科学中的“自下而上”之道
python·数据挖掘·数据分析
luoluoal4 小时前
基于python的医疗问句中的实体识别算法的研究(源码+文档)
python·mysql·django·毕业设计·源码
啊阿狸不会拉杆4 小时前
《机器学习导论》第 9 章-决策树
人工智能·python·算法·决策树·机器学习·数据挖掘·剪枝
喵手4 小时前
Python爬虫实战:城市停车收费标准自动化采集系统 - 让停车费透明化的技术实践(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·城市停车收费标准·采集城市停车收费数据·采集停车数据csv文件导出
无水先生4 小时前
python函数的参数管理(01)*args和**kwargs
开发语言·python