[Python知识库] Python绘制词云图

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> Python绘制词云图 -> 正文阅读

[Python知识库]Python绘制词云图

wordcloud：

安装模块：pip install wordcloud
基本使用：
- WordCloud(font_path, background_color, width, height, max_words).generate(xxx)
  - font_path：文本的字体
  - collocations：是否包含两个词的搭配，默认为true，所以会有重复的数据
  - background_color：背景色
  - width：幕布的宽度
  - height：幕布的高度
  - max_words：显示的最大词个数
  - generate：读取文本文件
案例：

from wordcloud import WordCloud

with open("xxx.txt", encoding="utf-8") as r:
    # 读取文本内容
    txt = r.read()
    # 设置词云图的样式
    wordcloud = WordCloud(font_path="xxx.ttf", collocations=False, background_color="black", width=800, height=600, max_words=50).generate(txt)
    # 生成图片
    img = wordcloud.to_image()
    # 展示图片
    img.show()
    # 保存图片
    wordcloud.to_file("xxx.jpg")

jieba：

安装模块：pip install jieba
基本格式：
- jieba.analyse.extract_tags(xxx, topK, withWeight, allowPOS)
  - xxx：需要处理的文本
  - topK：返回关键字的数量，重要性从高到低
  - withWeight：返回每个关键字的权重
  - allowPOS：需要提取的词性，n为名词、v为动词，传的值为元祖
案例：

import jieba.analyse
from wordcloud import WordCloud

# 设置文本内容
text = ""
# 使用jieba分词，提取关键词
seg_list = jieba.analyse.extract_tags(text, allowPOS=("n", "v"))
# 拼接关键词成字符串
txt_str = " ".join(seg_list)

# 设置词云图的样式
wordcloud = WordCloud(font_path="xxx.ttf", collocations=False, background_color="black", width=800, height=600, max_words=50).generate(txt_str)
# 生成图片
img = wordcloud.to_image()
# 展示图片
img.show()
# 保存图片
wordcloud.to_file("xxx.jpg")