| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> 爬取游民福利,搞了一堆美女图片,代码奉上,多张福利 -> 正文阅读 |
|
[Python知识库]爬取游民福利,搞了一堆美女图片,代码奉上,多张福利 |
目录 因为想要爬取一些福利图片,花了差不多1个半小时的时间写了这个图片的爬虫,虽然还是有些问题,但是能爬下来图片就够了,下面开始聊一下, 展示成果:注:这只是一页的数据,网站总共有262 页哦 分析网站目标网站: 游民星空的游民福利,基本上是一些美女图片,LSP喜欢,废话不多说,开始吧 Url 如下:https://www.gamersky.com/ent/xz/ 打开网址,选择自己想要查看的,右键 -> 检查,就可以直接查看到对应的html 代码。 href 就是对应的链接 分析下url找个每个详情页的地址 进入到详情页查看每个图片的url 最终找到图片的详细地址 总结下:
技术分析之前没写过爬虫,所以技术上没有什么经验,但是爬虫领域python是最火的,所以果断放弃Java,选择python,有段时间没写python了,有点生疏了,管他呐,不会就查,开干!!! 选择的IDE 是pycharm ,因为习惯了idea python 是选择了3.9的版本,随便下的 使用的库是BeautifulSoup 和 requests 直接上代码:
注:图片下载可运行遇到的困难1.bs4 的安装 在pycharm 中无法安装,不知道什么情况,即使换了阿里的和清华的源依然不行,最后是在控制台安装 2.字符串的拆分 字符串的拆分的函数提示不好,不如Java方便 网站的字符串存在一些不规律,也没有深度探索 未解决的问题:1.首页的翻页问题,现在只解决了首页的下载,还需要研究 2.程序的一些警告没有处理,直接无视了 requests.packages.urllib3.disable_warnings() 3.图片网址的前半部分是否需要拆分的问题,在浏览器中可以查看,但是爬取的时候似乎有点问题,没有深究 注意:爬虫虽好,可不要多用,会浪费网站的服务器性能 常规福利 赶紧点赞,分享 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/25 14:06:21- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |