IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python Chrome + selenium自动化测试与python爬虫获取网页数据 -> 正文阅读

[Python知识库]python Chrome + selenium自动化测试与python爬虫获取网页数据

一、使用Python+selenium+Chrome 报错:
selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 78

说明,这个chrom驱动支持78版本

谷歌浏览器版本

在这里插入图片描述
进入驱动网址:http://npm.taobao.org/mirrors/chromedriver/,下载对应版本的谷歌驱动
在这里插入图片描述
下载后放在与python解析器同一文件夹下面
在这里插入图片描述
重新运行程序,运行成功!!!

二、实例测试:
使用python selenium自动化测试模块结合python爬虫获取网页数据。

使用谷歌浏览器模拟打开https://www.hao123.com/网页,浏览器点击百度衔接,模拟输入python进行百度搜索,在关闭子网页,最后在https://www.hao123.com/网页获取精选新闻信息。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.python控制谷歌浏览器
main.py

"""=== coding: UTF8 ==="""
from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
import time

"""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':
    web = Chrome()
    web.get("https://www.hao123.com/")

    # 谷歌浏览器模拟人工点击“百度”衔接
    web.find_element_by_xpath('//*[@id="userCommonSites"]/ul/li[1]/div/a').click()
    time.sleep(1)

    # 变更selenium窗口视角,切换到子窗口,-1代表在网页标签页最后一个网页
    web.switch_to.window(web.window_handles[-1])
    # 谷歌浏览器模拟人工输入“python”,进行百度搜索
    web.find_element_by_xpath('//*[@id="kw"]').send_keys("python", Keys.ENTER)
    time.sleep(1)
    # 关闭子窗口
    web.close()

    # 变更selenium窗口视角,回到原来的窗口
    web.switch_to.window(web.window_handles[-1])

    # 提取精选新闻内容
    a_list = web.find_elements_by_xpath('//*[@id="topzixun-over"]/div/div[2]/p')

    for a in a_list:
        print(a.find_element_by_xpath('./a[1]').text)

    # 关闭窗口
    web.close()

    # 对于嵌入的视频窗口,切换到iframe窗口
    # iframe = web.find_elements_by_xpath('......')
    # web.switch_to.frame(iframe)
    # 切换到原画面
    # web.switch_to.default_content()

2.python使谷歌浏览器在后台运行,爬取数据(即无头浏览器)
main.py

"""=== coding: UTF8 ==="""
from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
import time

"""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':
    # 准备好参数配置(使谷歌浏览器在后台运行,即无头浏览器)
    opt = Options()
    opt.add_argument("--headless")
    opt.add_argument("--disbale-gpu")
    # 把参数配置到谷歌浏览器中
    web = Chrome(options=opt)

    web.get("https://www.hao123.com/")

    # 谷歌浏览器模拟人工点击“百度”衔接
    web.find_element_by_xpath('//*[@id="userCommonSites"]/ul/li[1]/div/a').click()
    time.sleep(1)

    # 变更selenium窗口视角,切换到子窗口,-1代表在网页标签页最后一个网页
    web.switch_to.window(web.window_handles[-1])
    # 谷歌浏览器模拟人工输入“python”,进行百度搜索
    web.find_element_by_xpath('//*[@id="kw"]').send_keys("python", Keys.ENTER)
    time.sleep(1)
    # 关闭子窗口
    web.close()

    # 变更selenium窗口视角,回到原来的窗口
    web.switch_to.window(web.window_handles[-1])

    # 提取精选新闻内容
    a_list = web.find_elements_by_xpath('//*[@id="topzixun-over"]/div/div[2]/p')

    for a in a_list:
        print(a.find_element_by_xpath('./a[1]').text)

    # 关闭窗口
    web.close()

    # 对于嵌入的视频窗口,切换到iframe窗口
    # iframe = web.find_elements_by_xpath('......')
    # web.switch_to.frame(iframe)
    # 切换到原画面
    # web.switch_to.default_content()

关注公众号,获取更多资料
在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-10-23 12:25:47  更:2021-10-23 12:25:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 21:09:46-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码