IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> Python词云制作基本流程,自己的学习总结,希望可以帮助到大家,同时本人为初学者,希望大家可以不吝赐教,谢谢大家。 -> 正文阅读

[Python知识库]Python词云制作基本流程,自己的学习总结,希望可以帮助到大家,同时本人为初学者,希望大家可以不吝赐教,谢谢大家。

词云

基本流程

????1. 导入库

from wordcloud import wordcloud
import jieba                 # 中文分词
import re                    # 可以使用re.sub()方法来处理字符串(如果想用的话)
from PIL import Image        # 用于指定生成词云形状
import numpy as np

????2. 输入/读取文本,并进行处理

"""
text = '离离原上草,一岁一枯荣。'\
       '野火烧不尽,春风吹又生。'\
       '远芳侵古道,晴翠接荒城。'\
       '又送王孙去,萋萋满别情。 '
"""

# 读取文本(r:只读; rb:二进制(图片、视频……)打开只读)
with open(' .txt', 'r', encoding='utf-8')as f:
 	 text = f.read()  
# 若想删除所有换行符,不能直接加入text.strip(),因为read是读取所有内容,大部分换行符位于文本内部,而text.strip()只能去除字符串前后(左右侧)的空格或特殊字符
     
# 去除无意义的词,也可以在创建词云对象的时候添加stopwords属性
text = re.sub(r'[我你他她它们自己的]', '', text)  

text_list = jieba.lcute(text)         # 返回对象为列表
text_str = ' '.join(text_list)        # 将列表各个元素拼接起来,并以空格隔开,返回对象为字符串

????3. 指定词云形状

mask = np.array(Image.open('zg.jpg'))  # 然后在词云对象属性那里,设置mask=mask

????4. 实例化词云对象(设置属性),并传入文本创建词云

wc = wordcloud(font_path=' ',background_color='white',  )
wc.generate(text_str)

# 常用设置:
# 设置背景颜色三种方法:
  # 1、background_color='white'(颜色名称);
  # 2、background_color='#FFF0F5'(16进制颜色码);
  # 3、background_color=(255, 240, 245)(RGB)

# 设置词云图片形状:mask=mask
# 设置词云图片宽度:width(default=400)
# 设置词云图片高度:height(default=200)
# 设置最小字体大小:min_font_size(default=4)
# 设置文字与词云图片边框留白宽度:margin(default=2)

????5. 保存词云图片

wc.to_file('词云.png')   # 也可以在文件名前面指定保存路径

补充1:随机生成多个词汇

import random
res_list = random.choices(['美丽', '优雅', '善良', '聪明'], k=16)   # k为随机生成的个数,返回结果为列表list
print(res_list)

# 结果 >>>['优雅', '美丽', '善良', '聪明', '优雅', '善良', '美丽', '善良', '优雅', ……]

补充2:绝对路径打开文件

# 使用绝对路径打开文件时,遇到下面的错误,可以尝试在绝对路径前加'r',eg,r'C:\Users\huawei\Desktop\zg.png'
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape

补充3:read、readline与readlines

# read          读取全部内容      返回字符串
# readline      读取1行内容      返回字符串
# readlines     读取每1行内容     返回列表,列表的每个元素为读取到的每一行的内容
# 可以使用line.strip()删除末尾的'\n'
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-12-14 15:53:53  更:2021-12-14 15:55:33 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/16 4:31:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码