前言

selenium模块是什么，有什么用？

便捷的获取网站中动态加载的数据
便捷实现模拟登录
基于浏览器自动化的一个模块

在使用这个模块之前，要先下载一个浏览器的驱动程序（谷歌浏览器）

下载路径：http://chromedriver.storage.googleapis.com/index.html 驱动程序和浏览器的映射关系：selenium之 chromedriver与chrome版本映射表（更新至v2.46）_灰蓝-CSDN博客_chromedriver

案例

之前对药监局实现了一次公司名称抓取，因为发现该页面是ajax动态加载，无法通过直接获取首页页面数据来获得公司名称，之前选择先获取首页数据，再从中获取详情页所对应的id，再对详情页发送请求获取详情页公司名称

这次采用selenum模块实现自动获取公司名称

先实例化一个浏览器对象（传入浏览器的驱动程序），并对网站发起请求，固定写法

?from selenium import webdriver
?from selenium.webdriver.chrome.service import Services = Service(r"./chromedriver.exe")
?driver = webdriver.Chrome(service=s)
?#让浏览器发起指定url请求
?driver.get('http://scxk.nmpa.gov.cn:81/xk/')

休息3s，等待页面加载出来，之后获取浏览器当前页面的页面源码数据e

?from time import sleep
?sleep(3)
?page_text=driver.page_source

利用抓包工具，解析企业名称

通过定位企业名称对应的html页面，发现其在多个li标签下，而li标签上一级标签为ul标签，但是html页面中可能有多个ul标签，但是每个ul标签的id是唯一的。

?from lxml import etree
?tree=etree.HTML(page_text)
?li_list=tree.xpath('//ul[@id="gzlist"]/li')
??
?for li in li_list:
? ?  name=li.xpath('./dl/@title')[0]
? ?  print(name)
?sleep(5)
?driver.quit()

开发测试最新文章

pytest系列——allure之生成测试报告（Wind

某大厂软件测试岗一面笔试题+二面问答题面试

iperf 学习笔记

关于Python中使用selenium八大定位方法

【软件测试】为什么提升不了？8年测试总结再

加:2021-11-30 15:55:05 更:2021-11-30 15:56:16

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/13 4:31:44-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码