IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 小福利3,带你用Python里面的正则表达式爬取百度全球疫情大数据 -> 正文阅读

[大数据]小福利3,带你用Python里面的正则表达式爬取百度全球疫情大数据

大家好,我是天空之城,今天给大家带来小福利3,带你用Python里面的正则表达式爬取百度全球疫情大数据,效率杠杠滴!

import requests,re
headers = {
        'Referer': 'http://www.voice.baidu.com/',
        'Origin':'http://www.voice.baidu.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
    }

url='https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_banner&city=%E7%BE%8E%E5%9B%BD-%E7%BE%8E%E5%9B%BD'
res=requests.get(url=url,headers=headers).text
result=re.findall('"city":"(.*?)","cityCode"',res)
# print(result)
for i in result:
    am=bytes(i,'utf-8')
    print(am.decode('unicode-escape'))

爬取数据截图如下:
在这里插入图片描述
进一步处理得到:

import requests,re
headers = {
        'Referer': 'http://www.voice.baidu.com/',
        'Origin':'http://www.voice.baidu.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36',


    }

url='https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_banner&city=%E7%BE%8E%E5%9B%BD-%E7%BE%8E%E5%9B%BD'
res=requests.get(url=url,headers=headers).text
result=re.findall('"city":"(.*?)","cityCode"',res)
# print(result)
for i in result:

    am=bytes(i,'utf-8')

    # print(am.decode('unicode-escape'))
    amn=am.decode('unicode-escape')

    ams=amn.replace("crued","治愈").replace("confirmedRelative","确诊相关").replace("died","死亡").replace("confirmed","确诊").replace("asymptomaticRelative","无症状相关").replace("nativeRelative","本土相关").replace("curConfirm","确诊治愈").replace("asymptomatic","无症状").replace("crued","治愈")

    print(ams)

处理后数据截图得到:
在这里插入图片描述

下面捕捉一下其他国家的疫情数据:

import requests,re
headers = {
        'Referer': 'http://www.voice.baidu.com/',
        'Origin':'http://www.voice.baidu.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36',


    }

url='https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_banner&city=%E7%BE%8E%E5%9B%BD-%E7%BE%8E%E5%9B%BD'
res=requests.get(url=url,headers=headers).text
result=re.findall('"city":"(.*?)","diedPercent"',res)
# print(result)
for i in result:

    am=bytes(i,'utf-8')

    # print(am.decode('unicode-escape'))
    amn=am.decode('unicode-escape')
    # print(amn)

    # ams=amn.replace("crued","治愈").replace("confirmedRelative","确诊相关").replace("died","死亡").replace("confirmed","确诊").replace("asymptomaticRelative","无症状相关").replace("nativeRelative","本土相关").replace("curConfirm","确诊治愈").replace("asymptomatic","无症状").replace("crued","治愈")

    ams = amn.replace("died", "死亡").replace("diedPercent", "死亡率").replace("crued", "治愈").replace("confirmedRelative", "确诊相关").replace("confirmed","确诊").replace("curedPercent", "治愈率").replace("curConfirm", "确诊治愈")


    print(ams)

获得国外疫情数据截图如下:
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-29 09:09:56  更:2021-08-29 09:25:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/18 16:42:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码