实验目的:
1. 能够自行安装jieba库和wordcloud库;
2. 能灵活运用jieba库进行中文分词;
3. 能灵活运用和wordcloud库进行词云分析。
实验题目:
1. 自行安装第三方库jieba库和wordcloud库;
2. 利用jieba库对《党的十九届六中全会精神》全文的前10个热点词汇进行统计;
3. 利用wordcloud库对党的十九届六中全会精神全文做词云分析,词云形状自定,可以是心形的,长方形的,我国的地图形状都可以,充分发挥你的聪明才智和想象力吧!
实验要求:
*《党的十九届六中全会精神》*全文自行在网上搜索并存为文本文件,将源文件和运行结果截图上传。
一.软件安装
jieba库的安装
(cmd命令行)
pip install jieba
也可以安装国内镜像:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba
**
WordCloud库的安装
**
pip install wordcloud
二.代码
1.十九大txt文件 2.jieba代码
import jieba
txtfilepath='十九届.txt'
with open(txtfilepath,encoding='utf-8') as f:
txt=f.read()
words=jieba.cut(txt)
counts={}
for word in words:
if len(word)==1:
continue
else:
counts[word]=counts.get(word,0)+1
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
word,count=items[i]
print("{0:<8}{1:>8}".format(word,count))
3.运行结果 4.wordcloud代码
import jieba
from wordcloud import WordCloud
import numpy as np
from PIL import Image
mask1=np.array(Image.open("meiyangyang.jpg"))
txtfilepath='十九届.txt'
with open(txtfilepath,encoding='utf-8')as f:
txt=f.read()
words=jieba.cut(txt)
newtxt=''.join(words)
wc=WordCloud(background_color="white",
width=550,
height=550,
font_path="msyh.ttc",
max_words=100,
mask=mask1,
max_font_size=80
)
wc.generate(newtxt)
wc.to_file('十九届.png')
注: “meiyangyang.jpg”<---->添加自己喜欢的图片
|