IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> JavaScript知识库 -> python爬虫学习44 -> 正文阅读

[JavaScript知识库]python爬虫学习44

python爬虫学习44

Ajax数据爬取

有时我们使用request抓取页面时,经常出现我们获取到的内容和我们在浏览去实际看到的内容不一致的情况,这是由于我们通过requests得到的结果都是原始的HTML文档,而浏览器的页面是经过JavaScript数据处理之后的结果,这些数据有多种来源:

  • 通过Ajax加载
  • 包含在HTML文档中
  • 经过JavaScript和特定算法处理后生成

我们今天要处理的问题就是第一种来源的数据,通过Ajax加载的数据通过一种异步的方式进行加载,原始页面不会包含某些数据,直到原始页面加载完成后,会再向服务器请求某个接口获得数据,然后数据才会经过处理呈现出我们所见的样子,这其实就是发送了一个Ajax请求。

在这种情况下,直接使用requests等库进行数据抓取就无法获得我们想要的数据。就需要我们分析网页的后台向接口发送Ajax请求。

1. 什么是Ajax

Ajax,全称Asynchronous JavaScript and XML(异步的JavaScript 和 XML),这是一种利用JavaScript在保证页面不被刷新、页面链接不改变的前提下与服务器交换数据并更新部分网页数据的技术。

例如,我们在网页上浏览微博时,向下浏览的时候会出现,下滑出现更多的选项,当我们下滑进行浏览时,此时网页没有变化,但是页面上却出现了新的内容,这就是一种Ajax加载的过程。

2.分析Ajax

进入微博后按下F12键,打开开发者页面,进行检阅:
可以看许多条请求,找到类型为xhr的请求,即为一条Ajax请求
在这里插入图片描述

首先找到一个Ajax类型的请求,查看其详细信息

在这里插入图片描述

可以看到最后一行,一个x-requested-with: XMLHttpRequest标记

preview标签中存储了响应的内容:

在这里插入图片描述

response标签,储存了法务其返回的原始数据:

在这里插入图片描述

正是通过这些返回的内容,从而实现了网页的渲染,让我们看到了我们现在看到的网页的样子。

今日结束,明日继续。。。

  JavaScript知识库 最新文章
ES6的相关知识点
react 函数式组件 & react其他一些总结
Vue基础超详细
前端JS也可以连点成线(Vue中运用 AntVG6)
Vue事件处理的基本使用
Vue后台项目的记录 (一)
前后端分离vue跨域,devServer配置proxy代理
TypeScript
初识vuex
vue项目安装包指令收集
上一篇文章      下一篇文章      查看所有文章
加:2022-06-03 23:55:30  更:2022-06-03 23:55:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 16:46:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码