IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发测试 -> selenium用法浅析 -> 正文阅读

[开发测试]selenium用法浅析

对于一些程序化的WEB操作,Python 的requests和selenium都能够很方便实现。前者适用于程序逻辑和参数清晰明确的快速自动化。参数构造复杂和需要图形化时,selenium或许就是更好的选择。这篇适用于有了想要实现的自动化目标,结合内容快速编写相应代码。

浏览器驱动

geckodriver适用于Firefox,chromedrvier适用于chrome,下载对应的驱动即可。

绕过反爬的风控机制

网上已有的分析就不重复搬运了,这篇selenium 成功绕过淘宝登录反爬机制就对淘宝的反爬做了分析。

# 如下代码可以绕过大多数反爬的机制
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.keys import Keys

option = webdriver.ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])  # 这里去掉window.navigator.webdriver的特性
option.add_argument("--disable-blink-features=AutomationControlled")
browser = webdriver.Chrome(executable_path="E:/Python/chromedriver.exe", options=option)
browser.get('https://www.baidu.com')

定位和操作元素

浏览器的对于WEB网页的操作无非鼠标移动,点击,键盘的键值发送这类操作。但这些操作也有些小坑在里面。操作的第一步就是定位需要被操作的对象,最常用的是通过浏览器的开发者模式直接复制XPATH或者CSS选择器来定位元素。F12打开开发者窗口-----》选取元素----》鼠标右键----》copy selector或者copy Xpath。

当然也是支持通过class name, link text, partial link text, tag name等来定位,具体参见selelium开发手册。

这里主要讲讲怎么灵活运用和结合这些元素定位操作,来精准完成程序的控制流。

有得元素需要加载出来才显示和可操作,可以用WebDriverWait来查找,避免直接查找元素出现找不到元素的error

# 等待页面加载一段时间才定位元素
css_selecot = '#kw'
ele = WebDriverWait(browser, timeout=30).until(
            EC.presence_of_element_located(
                (By.CSS_SELECTOR, css_selector)))
ele.click()

打开的窗口大小有差异,有时需要被点击的元素不在顶层,导致点击该元素会点到其他顶层的元素时可以通过JS来精准点击

css_selecot = '#kw'
ele = WebDriverWait(browser, timeout=30).until(
            EC.presence_of_element_located(
                (By.CSS_SELECTOR, css_selector)))
browser.execute_script("arguments[0].click();", ele)

隐藏的页面需要onmouseover事件发生才显示的元素,可以通过ActionChains实现移动鼠标到目标元素,显示隐藏元素并点击隐藏元素。

target_ele = browser.find_element_by_xpath('') # 鼠标移动到target_ele才显示hidden_ele
hidden_ele = browser.find_element_by_xpath('')
ActionChains(browser).move_to_element(target_ele).click(hidden_ele).perform()  
# ActionChains可以接很多操作,perform()执行前面的操作,如果不够稳定,可以拆分操作步骤

对于加载完成属性等有变化的元素,可以监控属性值保证在正确的时机完成操作

# 例:对于文件上传,上传中确认按钮为灰,上传完成后确认按钮才会变红。上传完成的时间又受网速等不确定因素影响。点击过早会操作程序失败。可以监控属性变化,在正确时间完成点击操作。
def able_click(css_selector, ):   # 背景变红才点击
    # print('\n[*] 监听按钮中',end='')
    ele = WebDriverWait(browser, timeout=30).until(
            EC.presence_of_element_located(
                (By.CSS_SELECTOR, css_selector)))
    while ele.value_of_css_property('background').find('9,') < 0:
        sleep(2)
        ActionChains(browser).move_to_element(ele).perform()
        ele = browser.find_element_by_css_selector(css_selector)
        print('.', end='')
    # sleep(1)
    browser.execute_script("arguments[0].click();", ele)
    return 0

有的元素不在视图中无法触发onmouserover之类的属性,可以先滚动页面直到显示

js = "arguments[0].scrollIntoView();"  # 滑动到显示对应元素的位置
mobiledescription = browser.find_element_by_id('struct-mobiledescription')
browser.execute_script(js, mobiledescription)

# 滑动到绝对位置
js = "var q=document.documentElement.scrollTop=400" #滑动到标题
browser.execute_script(js)

有的元素怎么定位都定位不到,那可能是内嵌的iframe中的元素,需要切换到对应的iframe才能定位和操作元素

# iframe能直接定位,也可以通过find_tag_name获取iframe的列表,并通过数组标记切换到指定iframe
detail_editor_iframe = browser.find_elements(By.TAG_NAME, 'iframe')[2]
browser.switch_to.frame(detail_editor_iframe)
browser.switch_to.parent_frame()

拖动一个或者多个本地文件到上传文件框实现文件上传

file_location = "/tmp/file1 \n /tmp/file2" # 文件绝对路径,两个不通文件之间插入 \n符
up_box = 'body  > input[type=file]'  # 文件上传框
browser.find_element_by_css_selector(up_box).send_keys(file_location)

删除原来input框填充值并写入新的值

product_title = WebDriverWait(browser, timeout=30).until(EC.presence_of_element_located((By.XPATH, '//*[@id="title"]')))

product_title.send_keys(Keys.COMMAND + 'a')  # 全选Keys,COMMAND是mac上的按钮,win用CONTROL
product_title.send_keys(Keys.DELETE)  # Keys.xxx 可以发送键盘操作
product_title.send_keys('new title')

自动化的WEB可能任意一步没有按照预期执行后面的执行流就乱了,需要不停的调试和写try catch处理异常。一个成熟的程序一定是千锤百炼和耐心的一遍一遍调试出来的。

参考文档

selenium中文开发手册

  开发测试 最新文章
pytest系列——allure之生成测试报告(Wind
某大厂软件测试岗一面笔试题+二面问答题面试
iperf 学习笔记
关于Python中使用selenium八大定位方法
【软件测试】为什么提升不了?8年测试总结再
软件测试复习
PHP笔记-Smarty模板引擎的使用
C++Test使用入门
【Java】单元测试
Net core 3.x 获取客户端地址
上一篇文章      下一篇文章      查看所有文章
加:2022-05-05 11:49:55  更:2022-05-05 11:50:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/19 16:19:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码