1 在windows10使用selenium爬取KEGG网页

需要的环境：

安装chrome和chromedriver（安装需要的浏览器，这里以Chrome为例；安装对应版本的chromedriver；加入环境变量；下面做详细说明）
安装selenium包（打开cmd；pip install selenium）

1.1 安装必要的包和软件

1.1.1 安装chromedriver

找到Chrome的版本号，在https://chromedriver.chromium.org/downloads下载对应的chromedriver。
在这里插入图片描述解压到Chrome的安装目录，见下图。

将以上两个软件加入环境变量。若加入成功，在cmd界面运行chrome
在这里插入图片描述

1.2 实例（爬取KEGG网页的KEGG Pathway）

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.kegg.jp/kegg/')##输入需要爬取的网页网址

在这里插入图片描述
按Ctrl+Shift+i打开开发者模式，按照下图顺序找到我们需要的KEGG PATHWAY的链接

在这里插入图片描述

link = driver.find_element_by_link_text('KEGG PATHWAY')##根据链接文本找到链接元素
link.click()##点击链接跳转到新的页面，见下图

在这里插入图片描述

html_source = driver.page_source##获取新网页的源代码
print(html_source)##见下图

在这里插入图片描述
参考：
https://www.geeksforgeeks.org/find_element_by_link_text-driver-method-selenium-python/
https://blog.csdn.net/xhaimail/article/details/105435794
https://chromedriver.chromium.org/downloads

开发测试最新文章

pytest系列——allure之生成测试报告（Wind

某大厂软件测试岗一面笔试题+二面问答题面试

iperf 学习笔记

关于Python中使用selenium八大定位方法

【软件测试】为什么提升不了？8年测试总结再

加:2021-10-12 23:46:32 更:2021-10-12 23:47:41

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/30 23:59:48-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码