一、xpath基本定位用法
1.1 使用id定位–driver.find_element_by_xpath(’//input[@id=“kw”]’)
1.2 使用class定位–driver.find_element_by_xpath(’//input[@class=“s_ipt”]’)
1.3 通过常用的8种方式结合xpath均可以定位(name、tag_name、link_text、partial_link_text)
二、xpath相对路径/绝对路径定位
2.1 相对定位–以// 开头 如://form//input[@name=“phone”]
2.2 绝对定位–以/开头,但是要从根目录开始i,比较繁琐,一般不建议使用,如:/html/body/div/a
三、xpath文本、模糊、逻辑定位
3.1 【文本定位】使用text()元素的text内容 如://button[text()=“登录”]
3.2 【模糊定位】使用contains() 包含函数 如://button[contains(text(),“登录”)]、//button[contains(@class,“btn”)] 除了contains不是=等于 多用于display属性
3.3 【模糊定位】使用starts-with – 匹配以xx开头的属性值;ends-with – 匹配以xx结尾的属性值 如://button[starts-with(@class,“btn”)]、//input[ends-with(@class,"-special")]
3.4 使用逻辑运算符 – and、or;如://input[@name=“phone” and @datatype=“m”]
四、xpath轴定位
4.1 轴运算
?ancestor:祖先节点 包括父 ?parent:父节点 ?preceding-sibling:当前元素节点标签之前的所有兄弟节点 ?preceding:当前元素节点标签之前的所有节点 ?following-sibling:当前元素节点标签之后的所有兄弟节点 ?following:当前元素节点标签之后的所有节点
使用语法:轴名称::节点名称 ?使用较多场景:页面显示为一个表格样式的数据列 ?如: 注意:
#定位 找到元素 -- 做到唯一识别
#优先使用id
#舍弃:有下标的出现、有绝对定位的出现、id动态变化时舍弃
from selenium import webdriver
import time
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
driver.get("https://www.baidu.com/")
driver.maximize_window()
time.sleep(3)
# 定位百度搜索框
driver.find_element_by_id("kw").send_keys("python")
time.sleep(3)
driver.find_element_by_id("su").click()
time.sleep(5)
# 找到这个元素
ele = driver.find_element_by_xpath('//a[text()="_百度百科"]')
# 拖动元素到可见区域--scrollIntoView() 拉到顶部显示,有可能会被导航栏遮挡,定位不到而报错;scrollIntoView(false)可视区域底部对齐
driver.execute_script("arguments[0].scrollIntoView(false);", ele)
time.sleep(5)
driver.quit()
定位后的常见操作
?get(url)?? ??????打开网页
?send_keys(str) ? ?????输入
?click()??????????点击
?clear()??????????清空
?text?????????获取标签文本内容
?get_attribute(‘属性’)??获取元素属性值
?close()????????关闭当前标签页
?quit()???????关闭浏览器,释放进程
FAQ
1.脚本结束如果没有调用quit()方法,chromedriver进程会在后台继续运行,大概占用4M空间,如果创建多了不关,会导致电脑卡
import(‘os’).system(“taskkill /f /t /im chromedriver.exe”)
无处安放的Xpath
?1.元素没有id,name,class等明显或者唯一属性
?2.元素id是动态
?3.元素定位工具抓取不到
?4.复制xpath的路径不稳定 ??复制1://[@id=“ko-content”]/div[2]/div[3]/div/div[2]/div[2]/input ??复制2://[@id=“ko-content”]/div[2]/div[3]/div/div[2]/div[3]/input
?元素本身没有变化,其他元素修改导致该元素定位失效
特点:灵活、稳定、万能
xpath的思想:通过路径找节点(元素属性、内容)
如何写xpath表达式:
xpath语法规则
/?根节点,节点分隔符 //?任意位置 *?任意元素 @?属性 .?当前节点 …?父级节点 text?文本值
五、写xpath的两种方式
格式
属性://*[@属性=‘属性值’] ?如://(星号)[class=“am-dropdown-toggle”] 文本值://(一个星号)[text()=‘文本值’] ?如://(星号)[text()=‘人才招聘’]
高级查询
contains模糊查询:contains(@属性/text(),值) ?如://(星号)[contains(text(),院系专业)] starts-with:以xxx开始,匹配一个属性开始位置的关键字
上下级查询: ?//*[@type=‘password’]/…/…/…/div[3]
多个条件and: ?//*[@class=‘mnav’ and @type=‘password’]
特殊: ?svg:name属性 ??//*[name()=‘svg’]
|