IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python词云 傻瓜式教程 有手就会!看懂了就能用!啊( ?? ω ?? )? -> 正文阅读

[Python知识库]python词云 傻瓜式教程 有手就会!看懂了就能用!啊( ?? ω ?? )?

首先是准备工作:

要用到的库

import matplotlib.pyplot as plt #用于可视化画图
from wordcloud import WordCloud #词云
import jieba #用于中文分词

字体文件处理

如果text(用于生成词云的数据是中文的话),需要将字体文件复制在项目文件里:

字体文件所在地址:在这里插入图片描述

复制到项目文件中:
在这里插入图片描述在这里插入图片描述

第一个很简单但是很丑的

先来一个很简单的,当然简单就意味着丑陋 (╬▔皿▔)╯

顺序:
1、text文字数据
2、jieba库 进行分词
3、生成词云 wordcloud库
4、画图

?【jieba】的用法:
https://blog.csdn.net/TFATS/article/details/108810284

在这里插入图片描述

实现:

import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba

text = '作为一只咸鱼,我最大的爱好就是划水和摸鱼'

after_jieba = jieba.cut(text, cut_all = True)
after_split = " ".join(after_jieba)

wordcloud = WordCloud(font_path = "SIMYOU.TTF").generate(after_split)

plt.imshow(wordcloud)
plt.axis("off")
plt.show()

生成了一个初始化的词云~
在这里插入图片描述

?【wordcloud】的用法:
https://blog.csdn.net/weixin_43826242/article/details/86658573

?词云调整文字颜色:
https://blog.csdn.net/weixin_45203845/article/details/104324863

在了解了wordcloud的参数情况~ 可以尝试对词云的形状进行变形~
用到的背景图是这张,取名为 xin.png
在这里插入图片描述
将这个图片文件和前面提到的文字一样存到项目文件下~
在这里插入图片描述
然后呢~在上一个的基础上修改一下代码:
在这里插入图片描述
实现:

import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
from PIL import Image
import numpy as np
from matplotlib import colors

text = '作为一只咸鱼,我最大的爱好就是划水和摸鱼 miao wumiaowu wulawula'

after_jieba = jieba.cut(text, cut_all = True)
after_split = " ".join(after_jieba)

mk=np.array(Image.open("xin.png"))
color_list=['#ffb5e4','#8fb4f3']
colormap=colors.ListedColormap(color_list)
wordcloud = WordCloud(font_path = "SIMYOU.TTF", mask=mk, background_color="white", colormap=colormap).generate(after_split)

plt.imshow(wordcloud)
plt.axis("off")
plt.show()

生成了一个很Q的词云~~好可爱QAQ
在这里插入图片描述

来一个有一点难度的吧,用聊天记录做词云~

顺序:
1、导出聊天记录
2、处理聊天记录数据
3、修改上一个代码(皮)

导出记录长这样~:
在这里插入图片描述
同样可以先将聊天记录放入项目文件夹中~用英文名字最好
在这里插入图片描述
然后是对聊天记录进行数据清洗~
在这里插入图片描述

比如我想去掉紫色箭头指向的日期和昵称。我用正则表达式来做~
首先要用到的库库

import re

在这里插入图片描述
在这里插入图片描述
实现:

import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
from PIL import Image
import numpy as np
from matplotlib import colors
import re

f = open('liao.txt','r',encoding = 'utf-8')
text = f.read()

# 去掉 日期-时间-名字 那一行
qudiao = re.findall(r"2021-.+", text)

for q in qudiao:
    text=text.replace(q,'')
#print(text)

# 去掉[图片]
qu = re.findall(r'[图片]',text)

for p in qu:
    text=text.replace(p,'')

after_jieba = jieba.cut(text, cut_all = True)
after_split = " ".join(after_jieba)

mk=np.array(Image.open("xin.png"))

color_list=['#ffb5e4','#8fb4f3']
colormap=colors.ListedColormap(color_list)
wordcloud = WordCloud(font_path = "SIMYOU.TTF", mask=mk, background_color="white", colormap=colormap).generate(after_split)

'''
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
'''
wordcloud.to_file('liaotian.png')

成果~
但是呢,我发现这个词云图上面显示的聊天记录分词并不完全。。不知道为啥 今天先到这里吧。
在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-08-12 16:33:29  更:2021-08-12 16:34:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 4:10:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码