[开发测试] ＜爬虫＞通过selenium爬取历史电力数据

IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 开发测试 -> ＜爬虫＞通过selenium爬取历史电力数据 -> 正文阅读

[开发测试]＜爬虫＞通过selenium爬取历史电力数据

网址：Sonnagh, Ireland Weather History | Weather Underground

观察

通过观察发现，不同日期的数据网址的末尾有差别。例如，2019年11月1号和2号的数据网址分别如下：

https://www.wunderground.com/history/daily/ie/sonnagh/EIKN/date/2019-11-1

https://www.wunderground.com/history/daily/ie/sonnagh/EIKN/date/2019-11-2

因此只需要改变网址末尾的日期就可以爬到不同日期的数据。

代码

from selenium import webdriver
from bs4 import BeautifulSoup as bs
import time
import pandas as pd

获取网页的源代码函数，要等待网站加载完才能爬到数据，因此设置time.sleep( )

def get_soup(url):
    browser.get(url)
    time.sleep(9)
    html = browser.page_source # 获得网页源代码
    soup = bs(html) 
    return soup

按照网页的结构找到需要的

开通VIP 解锁文章

开发测试最新文章

pytest系列——allure之生成测试报告（Wind

某大厂软件测试岗一面笔试题+二面问答题面试

iperf 学习笔记

关于Python中使用selenium八大定位方法

【软件测试】为什么提升不了？8年测试总结再

软件测试复习

PHP笔记-Smarty模板引擎的使用

C++Test使用入门

【Java】单元测试

Net core 3.x 获取客户端地址

上一篇文章下一篇文章查看所有文章

加:2021-11-25 08:25:13 更:2021-11-25 08:25:47

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/18 11:18:50-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码