| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> 2021最新版Python爬取无水印小姐姐短视频,超级简单!(附视频/源码) -> 正文阅读 |
|
[Python知识库]2021最新版Python爬取无水印小姐姐短视频,超级简单!(附视频/源码) |
好了,又来到了大家最喜欢的整活环节,爬小姐姐视频,本来爬正经视频的,但是想了想,还是要整点实用的,那必须换成小姐姐,直接整活!
大概思路一. 数据来源分析
二. 代码实现过程
各个模块的作用
自动判断有无文件夹,自动创建,文件夹名字可以自己随便命名,这里我们创建名字为video,这里也可以自己先创建一个相同名字的文件夹放在代码旁边。
很多文件下载下来后名字带有特殊符号的,这时候我们就要把这些特殊符号给替换掉,不然不能保存。
这一步需要安装好浏览器驱动,selenium 可以模拟人的行为去操作浏览器,模拟滑动操作。自己翻的话,多麻烦是吧。验证码没有写进来,需要自己手动过一下验证码。
实例化一个浏览器的对象
访问url地址网址
括号里面的内容替换成你想要爬取的博主,我就不放链接了,免得审核不过。
调用 find_element_by_css_selector() 方法
headers 请求头 伪装作用,user-agent: 浏览器的基本信息。
获取数据 response.text 获取响应体的文本数据
返回是列表没问题, [1] 索引取值 第一个元素索引位置是0 第二个元素索引位置 1。
解码
print(video_url)保存数据,response.content (获取响应体的二进制数据),为什么我要获取二进制数据呢,如果要保存图片/视频/音频/特定格式的文件,都是二进制数据保存的。
mode 保存方式, w 是写入, b 二进制模式 ,wb 以二进制方式保存, mode 默认是, r 读取,as 重命名 f。 然后看一下效果 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/27 0:04:13- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |