IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发测试 -> 爬虫-第一节-selenium的简单使用 -> 正文阅读

[开发测试]爬虫-第一节-selenium的简单使用


最近学会一个非常好用的包,用来爬取网页,做一个记录

1 在windows10使用selenium爬取KEGG网页

需要的环境:

  1. 安装chrome和chromedriver(安装需要的浏览器,这里以Chrome为例;安装对应版本的chromedriver;加入环境变量;下面做详细说明)
  2. 安装selenium包(打开cmd;pip install selenium)

1.1 安装必要的包和软件

1.1.1 安装chromedriver

找到Chrome的版本号,在https://chromedriver.chromium.org/downloads下载对应的chromedriver。
在这里插入图片描述解压到Chrome的安装目录,见下图。
在这里插入图片描述

将以上两个软件加入环境变量。若加入成功,在cmd界面运行chrome
在这里插入图片描述
在这里插入图片描述

1.2 实例(爬取KEGG网页的KEGG Pathway)

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.kegg.jp/kegg/')##输入需要爬取的网页网址

在这里插入图片描述
按Ctrl+Shift+i打开开发者模式,按照下图顺序找到我们需要的KEGG PATHWAY的链接

在这里插入图片描述

link = driver.find_element_by_link_text('KEGG PATHWAY')##根据链接文本找到链接元素
link.click()##点击链接跳转到新的页面,见下图

在这里插入图片描述

html_source = driver.page_source##获取新网页的源代码
print(html_source)##见下图

在这里插入图片描述
参考:
https://www.geeksforgeeks.org/find_element_by_link_text-driver-method-selenium-python/
https://blog.csdn.net/xhaimail/article/details/105435794
https://chromedriver.chromium.org/downloads

  开发测试 最新文章
pytest系列——allure之生成测试报告(Wind
某大厂软件测试岗一面笔试题+二面问答题面试
iperf 学习笔记
关于Python中使用selenium八大定位方法
【软件测试】为什么提升不了?8年测试总结再
软件测试复习
PHP笔记-Smarty模板引擎的使用
C++Test使用入门
【Java】单元测试
Net core 3.x 获取客户端地址
上一篇文章      下一篇文章      查看所有文章
加:2021-10-12 23:46:32  更:2021-10-12 23:47:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/18 2:41:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码