| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> Python知识库 -> 爬虫日记2:爬取好看的图片 -> 正文阅读 |
|
|
[Python知识库]爬虫日记2:爬取好看的图片 |
|
前段时间我有个朋友看到一些小姐姐的照片,想全部下载下来,叫我帮个忙。于是花费了半天给他全部下载了下来。
引入库
这三个库是为了让我们在请求别人网站的时候,让程序休息一会,避免别人的网站会拦截或者崩溃和将得到的页面源代码进行解析。 网页分析
利用浏览器的开发者模式,对页面进行分析,找出我们所需要的每个图片封面url
我们得到了封面的url后,但这还不是我们所需要的,我们所需要的是超链接里面的图片
?我们进入后,发现每张图片都在<p></p>里面,如何我们利用循环得到每张图片的url地址
剩下的就很简单了,我们只需对文件进行保存就得到我们想要的结果了。
总结 但同步下载非常慢,我们可以写个多线程或者异步协程来帮助我们下载得更快。 我知道还有很多不足,有没有更简洁的写法,希望大佬们能指出,谢谢! 完整代码
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/28 2:55:23- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |