IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> Python实现批量采集美女shipin<无水印> -> 正文阅读

[Python知识库]Python实现批量采集美女shipin<无水印>

前言

嗨喽~大家好呀,这里是魔王呐 !

环境使用:

  • Python 3.8

  • Pycharm

  • 谷歌浏览器

  • 谷歌驱动

安装教程都可以看文章下方推广获取~

模块使用:

  • requests >>> pip install requests

  • re

  • json 用来转换数据类型 序列化和反序列化模块

  • selenium >>> pip install selenium==3.141.0 <需要浏览器和浏览器驱动>

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

按照常规基本思路流程: <模板, 可以套用>

批量采集shipin —> 由浅到深 采集一个shipin 采集多个

一. 数据来源分析 <shipin内容>

通过开发者工具抓包分析, shipin url地址来自于哪里, shipin标题在什么地方

  1. F12打开开发者工具, 或者 鼠标右键点击检查选择network <在网页 在浏览器上面进行操作>

  2. 点击刷新 网页, 让本网页相关数据内容, 重新加载一遍 <相对应 相关数据包 数据内容 就展示出来>

  3. 找shipin链接在哪里 ----> 常规找shipinurl地址 是 media 里面

  4. 找shipin url 来源, 出处 —> 通过在开发者工具关键字搜索 可以找到我们想要的数据在哪里, 只是说
    找到数据是进行编码, 到时候写代码的时候 进行解码就Ok了

二. 代码实现步骤

  1. 发送请求, 模拟浏览器对于 网址 发送请求

  2. 获取数据, 获取response响应数据

  3. 解析数据, 提取我们想要shipin url地址 和 shipin标题

  4. 保存数据, 把shipin内容保存到本地

代码

需要更多源码、教程可点击网页端博主头像来到主页,点击左侧的流动文字免费获取哦~(可能需要往下划一下呐)

也可以直接查看文章下方推广加助理小姐姐V免费获取呐~

"""
selenium ---> 使用驱动 ---> 控制浏览器
    模拟人的行为去操作浏览器
"""
# 打开浏览器
driver = webdriver.Chrome()
# 访问网站
driver.get('https://www..com/user/MS4wLjABAAAA0ihE2gYz13hwfPpxiZz50L7QM761qG-m28wj-oyWJTMqEJh5TR92GIJI7r-FW-8n')
# 等待
driver.implicitly_wait(10)

def drop_down():
    """执行页面滚动的操作"""  # javascript
    for x in range(1, 10, 2):  # 1 3 5 7 9  在你不断的下拉过程中, 页面高度也会变的
        time.sleep(1)
        j = x / 9  # 1/9  3/9  5/9  9/9
        # document.documentElement.scrollTop  指定滚动条的位置
        # document.documentElement.scrollHeight 获取浏览器页面的最大高度
        js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % j
        driver.execute_script(js)

尾语

人的一生就像在攀登高峰,勤奋是你踏实稳健的双脚,

信念是你指引前行的向导,勇敢是你孜孜追寻的恒心。

开心日到了,愿你站稳双脚,确定方向,向着你的理想巅峰勇敢前行,

不用怕,未来就在你的脚下。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

对啦!!记得三连哦~ 💕 另外,欢迎大家阅读我往期的文章呀~

请添加图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-08-19 19:00:11  更:2022-08-19 19:02:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 9:56:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码