IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 爬虫——天气并数据可视化 -> 正文阅读

[人工智能]爬虫——天气并数据可视化

任务要求:

爬取天气网的历史天气数据,将其写入CSV 文件,格式如下图所示
在这里插入图片描述
对爬取到的数据的最高气温和最低气温进行可视化,要求使用 matplotlib 模块, 按下图所示设置两条折线的颜色(其中最高气温使用红色,最低气温使用蓝色)、 x 轴和 y 轴的文字、x 轴的刻度、图的标题和图例,最终结果保存到当前工作目 录下,命名为“WeatherData.png”。
结果示例如下:
标题

先导入所需要用到的包

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import requests
from bs4 import BeautifulSoup
import csv

此时进行bs4爬取数据

with open('Xian_weather.csv','w',newline='') as file:
    w=csv.writer(file)
    w.writerow(['日期','星期','最高气温','最低气温','天气','风向','风力'])
    temp_high = []
    temp_low = []
    # 对首页的页面数据进行爬取
    for i in range(1,13):
        if i<10:
            month='0'+str(i)
        else:
            month=str(i)
        url=f'http://lishi.tianqi.com/xian/2021{month}.html'
        response=requests.get(url=url,headers=headers)
        text=response.text
        #用bs4进行解析
        soup=BeautifulSoup(text,'lxml')
        li_list=soup.select('.thrui > li')
        #将每行的数据写入到csv文件中,并且将最高最低气温存到相应的列表之中
        for j in range(len(li_list)):
            a = li_list[j].text
            info_list = a.split()
            temp_high.append(int(info_list[2].replace('℃', '')))
            temp_low.append(int(info_list[3].replace('℃', '')))
            w.writerow(info_list)
        print('2021' + month + '的数据写入成功!')
    print("写入文件成功!")

标题

用matplotlib进行绘图

#由于文件名中含有中文会引起OSError,因此需要在后面加上engine='python'
df=pd.read_csv(r'C:\Users\Anan\PycharmProjects\爬虫\Xian_weather.csv',engine='python')

#为了防止中文乱码,在画图时需要加上这两句
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

#x轴代表的日期
x=pd.date_range('20210101',periods=365)
plt.plot(x, temp_high, 'r-', label='最高气温')
plt.plot(x, temp_low, 'b-', label='最低气温')

#标签,两条线所代表的内容
plt.legend()
plt.xlabel('日期')
plt.ylabel('气温(单位:℃)')
plt.title('西安2021年历史气温')
#给所画的图像进行命名
plt.savefig('./WeatherData.png')
plt.show()

在这里插入图片描述

总代码

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import requests
from bs4 import BeautifulSoup
import csv

headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36 Edg/99.0.1150.39'
    }

with open('Xian_weather.csv','w',newline='') as file:
    write=csv.writer(file)
    write.writerow(['日期','星期','最高气温','最低气温','天气','风向','风力'])

with open('Xian_weather.csv','w',newline='') as file:
    w=csv.writer(file)
    temp_high = []
    temp_low = []
    # 对首页的页面数据进行爬取
    for i in range(1,13):
        if i<10:
            month='0'+str(i)
        else:
            month=str(i)
        url=f'http://lishi.tianqi.com/xian/2021{month}.html'
        response=requests.get(url=url,headers=headers)
        text=response.text
        #用bs4进行解析
        soup=BeautifulSoup(text,'lxml')
        li_list=soup.select('.thrui > li')
        #将每行的数据写入到csv文件中,并且将最高最低气温存到相应的列表之中
        for j in range(len(li_list)):
            a = li_list[j].text
            info_list = a.split()
            temp_high.append(int(info_list[2].replace('℃', '')))
            temp_low.append(int(info_list[3].replace('℃', '')))
            w.writerow(info_list)
        print('2021' + month + '的数据写入成功!')
    print("写入文件成功!")

#由于文件名中含有中文会引起OSError,因此需要在后面加上engine='python'
df=pd.read_csv(r'C:\Users\Anan\PycharmProjects\爬虫\Xian_weather.csv',engine='python')

#为了防止中文乱码,在画图时需要加上这两句
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

#x轴代表的日期
x=pd.date_range('20210101',periods=365)
plt.plot(x, temp_high, 'r-', label='最高气温')
plt.plot(x, temp_low, 'b-', label='最低气温')

#标签,两条线所代表的内容
plt.legend()
plt.xlabel('日期')
plt.ylabel('气温(单位:℃)')
plt.title('西安2021年历史气温')
#给所画的图像进行命名
plt.savefig('./WeatherData.png')
plt.show()



本次爬虫小任务就告一段落了!!!

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 00:02:58  更:2022-04-01 00:06:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 0:22:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码