IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 最新酷狗音乐反爬来袭,Python掌握酷狗排行榜加密规则 -> 正文阅读

[Python知识库]最新酷狗音乐反爬来袭,Python掌握酷狗排行榜加密规则

大家好 ,我是辣条。

对你有用的话记得三连呦!

效果展示

爬取目标

网址:酷我音乐

在这里插入图片描述

工具使用

开发工具:pycharm

开发环境:python3.7, Windows10

使用工具包:requests,re

项目思路解析

找到需要解析的榜单数据

在这里插入图片描述

随意点击一个歌曲获取到音乐的详情数据 通过抓包的方式获取到音乐播放数据

在这里插入图片描述

找到MP3的数据提交地址 mp3数据来自于这个url地址

在这里插入图片描述在这里插入图片描述

提交数据的网址:

https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3dKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556

将多个网址数据进行对比看看哪些参数是需要自行修改的 在这里插入图片描述 变化的url数据有3个

  • hash

  • album_id

  • _

_ 可以明显看出来是时间戳 需要获取到对应的hash以及album_id的值 来到主页找寻对应的歌曲id数据 发现数据来自网页源代码 在这里插入图片描述

歌曲的数据都是来自网页源代码

在这里插入图片描述

梳理整体思路:

  • 从首页源码里提取出对应的hash、album_id值

  • 组合成新的url地址

  • 获取到json数据总的歌曲播放地址##

简易源码分析

本章内容只限学习,切勿用作其他用途!!!!!

import requests
import re
import time
?
?
def Tools(url):
 ? ?headers = {
 ? ? ? ?'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70'
 ?  }
 ? ?response = requests.get(url, headers=headers)
 ? ?return response
?
?
def Save(name, url):
 ? ?mp3 = Tools(url).content ?# 请求mp3地址链接 返回格式是16进制
 ? ?f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就写入  不存在就会创建  b进制读写
 ? ?f.write(mp3)
 ? ?f.close()
 ? ?print('{}下载完成....'.format(name))
?
?
url = 'https://www.kugou.com/yy/html/rank.html'
response = Tools(url).text
album_id = re.findall(r'"album_id":(\d*?),', response) # id
Hash = re.findall(r'"Hash":"(.*?)",', response) ?# hash
?
for a, h in zip(album_id, Hash):
 ? ?# 生成时间戳
 ? ?time1 = int(time.time() * 1000)
 ? ?# 包含歌曲下载地址的url
 ? ?urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)
 ? ?response1 = Tools(urls).json()
 ? ?audio_name = response1['data']['audio_name'].split('-')[1]
 ? ?play_url = response1['data']['play_url']
 ? ?Save(audio_name, play_url)
?

关注我持续为您分享干货内容,你的收藏、评论、点赞就是对我最大的支持!

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-07-30 12:42:21  更:2021-07-30 12:42:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/25 14:49:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计