IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发工具 -> python爬取某音乐歌词,将内容保存制作词云图 -> 正文阅读

[开发工具]python爬取某音乐歌词,将内容保存制作词云图

前言

嗨喽!大家好,这里是魔王。

音乐,无论什么时候都有无数人欣赏,好的歌曲还能共情!今天我们就来爬一爬音乐,使用歌词来制作一张有趣的词云图叭~
请添加图片描述

【介绍】

  1. python爬虫爬取某音乐歌词,将内容保存
  2. 并制作出词云图

【模块】

  1. requests 发送数据请求 (安装方法 >>>pip install requests)
  2. parsel 数据解析模块 (安装方法 >>>pip install parsel)
  3. jieba 中文分词 ( 安装方法 >>>pip install jieba)
  4. imageio 图片处理模块 ( 安装方法 >>>pip install imageio))
  5. wordcloud 词云图制作模块 (安装方法 >>>pip install wordcloud)

方法 : xpath爬取方法
请添加图片描述

【介绍内容】

需要的数据都是什么

  • 歌名
  • 歌词

在哪里,从哪里找

【代码实现步骤】

  1. 获取网页地址 (目标地址)
  2. 发送请求
  3. 数据解析
  4. 保存数据
  5. 制作词云图

【导入模块】

import requests
import parsel
import jieba
import imageio
import wordcloud

目标地址

url = ‘http://www.kuwo.cn/play_detail/199390992’
在这里插入图片描述

发送请求

html_data = requests.get(url=url).text    # <Response [200]> 数据请求成功

3.数据解及保存数据

sel = parsel.Selector(html_data)  # <Selector xpath=None data='<html data-n-head-ssr>\n  <head>\n    <...'>

name = sel.xpath('//*[@class="song_name flex_c"]/span/text()').get().strip()  # 歌名

lyric = sel.xpath('//*[@id="lyric"]/div/p/text()').getall()
# for i in lyric:
#     with open(name+'.txt',mode='a',encoding='utf-8')as f:
#         f.write(i)

在这里插入图片描述

制作词云图

# 1.读取文件
f = open(name + '.txt', mode='r', encoding='utf-8')
txt = f.read()
# 2.中文分词
txt_list = jieba.lcut(txt)
print('合并前',txt_list)

# 3.字符串合并
txt_str = ' '.join(txt_list)

# 4.图片处理模块
img = imageio.imread('五星.png')
# 5.词云图设置
word = wordcloud.WordCloud(
    width=1000,
    height=1000,
    background_color='gray',
    font_path='msyh',
    mask=img,
    # 停用词
    stopwords=set([i.strip() for i in open('cn-stopwords.txt', mode='r', encoding='utf-8').readlines()])
)
# 6.插入文件
word.generate(txt_str)
# 7.保存词云图
word.to_file(name + '.png')
print(name+'词云图','保存成功')

在这里插入图片描述

好了,我的这篇文章写到这里就结束啦!

希望你在python这条路上依心而行,别回头,别四顾。一如既往不改初见的模样,未来的路很长,不管怎样,一定要相信自己一直走下去。

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(? ?_?)?

  开发工具 最新文章
Postman接口测试之Mock快速入门
ASCII码空格替换查表_最全ASCII码对照表0-2
如何使用 ssh 建立 socks 代理
Typora配合PicGo阿里云图床配置
SoapUI、Jmeter、Postman三种接口测试工具的
github用相对路径显示图片_GitHub 中 readm
Windows编译g2o及其g2o viewer
解决jupyter notebook无法连接/ jupyter连接
Git恢复到之前版本
VScode常用快捷键
上一篇文章      下一篇文章      查看所有文章
加:2021-11-19 17:49:20  更:2021-11-19 17:51:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/24 1:01:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计