| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> 爬虫实例图片爬取--1(某领域) -> 正文阅读 |
|
[Python知识库]爬虫实例图片爬取--1(某领域) |
爬图片的流程1.向目标网站发送请求 2.获取数据(网页源码) 3.解析数据 4.向详情页发送请求 5.获取数据 确定网址,发起请求 导入请求库,然后发起请求
接着导入解析库
对数据进行解析
利用css来进行定位,
?::attr(src)是提取这元素中的src对应的地址。 但是提取出来并不好看,可以用for来进行再次提取
既然拿到了图片的地址,那么就对这个地址发起请求
?然后取这个地址的反斜杠最后一段,用来做图片的名称
接着创建一个名为img的文件夹用来存图片
可以了,但是就这四张太少了,来整多点!! 那么重新来一遍,对整体进行请求
? 这里有一堆 再次用css来进行定位 ?因为它的地址和名称都在这,所以
然后
把它们提取出来。 接着导入os模块,来创建文件夹
然后运行就完事了 完整代码如下:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/15 11:58:55- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |