| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> python爬虫seleium模块基本操作 -> 正文阅读 |
|
[Python知识库]python爬虫seleium模块基本操作 |
seleium是python中浏览器驱动模块,也是一个第三方库,在网络爬虫中,使用requests模块访问网站时,常常会遇到各种反爬措施,而seleium的出现可以模拟用户进行浏览器操作,能够看到正常用户使用浏览器的数据。 使用seleium模块和requests不同,并不是直接import一下就好,它需要用户下载浏览器驱动程序,谷歌浏览器就下载? chromedriver?? 火狐浏览器就下载geckodriver,以下两篇文章可以学到方法,这里不作为重点 谷歌:https://blog.csdn.net/zhoukeguai/article/details/113247342 火狐:https://blog.csdn.net/hy_696/article/details/80114065 导入时代码为from seleium import webdriver 首先我们需要实例化一个对象,作为后续的操作对象
这是火狐浏览器对应的代码,谷歌浏览器就把英文火狐换成谷歌,后面的是下载的对应浏览器驱动的路径。 小编在后面会综合引入一个例子,用下面的内容控制浏览器 对于实例好的brower对象,有几种主要的方法: get为访问的网址 ? ? ? ? ? ? ????????????????????????????? maximize/minimize_window()窗口最大最小化 page_source 当前页面源码???????????????????????? quit()退出 还有最重要的就是定位功能 seleium定位的方式是多种的,主要进行id、class、xpath、css选择器定位等,其中他们的值直接在网页源码中可以获得,想定位哪个标签就引入它们的值,对应的方法为 find_element_by_id/class_name/xpath(),括号内引入字符串,写入对应的值 其中id、class复制即可,xpath、css选择器也不用自己输入,如下图 ?火狐、谷歌都可以直接将这些内容复制到粘贴板上 举个例子,如果我们需要点击一个按钮,其class name为submit,点击操作分为两步,先定位此按钮,再进行点击,例如
?将这个按钮赋给一个变量search_btn,再.click即可 另外使用seleium可以查看标签的属性,例如它的herf属性,大小,位置,是否可用等等,后面的代码包含此内容 另外还可以对文本框内容进行代码中的赋值,利用send_keys函数,后面的代码也包含此内容 小编将上述内容总结成一段访问淘宝的代码段,并配上相应视频。
代码运行后,会一步一步控制浏览器,打印的结果如下图 ?结果为选中标签的各类信息 下面附上上述代码运行后,自动化控制浏览器的视频 seleium基本使用 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 0:22:47- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |