IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发工具 -> 2021-11-13 -> 正文阅读

[开发工具]2021-11-13

用python爬取微博评论数据,爬虫之路,永无止境。。(附源码)今天目标爬取微博任意博文的评论信息工具使用开发环境:win10、python3.6开发工具:pycharm工具包 :requests,re, time, random,tkinter项目思路分析1.网页版登录拿回cookie值2.选取要爬的博文评论信息的网页版网址https://weibo.com/3167104922/Kkl7ar83T#comment为例3.根据网页版的地址抓包拿回博文唯一的id值(weibo_id)4.构造博文手机版评论请求的地址f’https://m.weibo.cn/comments/hotflow?id={weibo_id}&mid={weibo_id}&max_id_type=0’5.发送请求拿回响应的json数据6.max_id和max_id_type的值确定7.构造data参数,下次翻页请求要加上参数""“构造GET请求参数”"" data = { ‘id’: weibo_id, ‘mid’: weibo_id, ‘max_id’: max_id, ‘max_id_type’: max_id_type }12345678.max_id为上一个包的翻页规律9.然后继续解析数据,获取评论信息内容,然后再翻页,一直回调。起始地址先进行登录https://weibo.com/登录之后点开一篇博文,点击评论,点击查看更多评论本文以https://weibo.com/3167104922/Kkl7ar83T#comment为例在这里插入图片描述search搜索weibo_id,构造headers里面的requests url,发送请求拿回weibo_id的值在这里插入图片描述进入手机版模式进行XHR抓包在这里插入图片描述在这里插入图片描述翻页用到data的参数""“构造GET请求参数”"" data = { ‘id’: weibo_id, ‘mid’: weibo_id,

  开发工具 最新文章
Postman接口测试之Mock快速入门
ASCII码空格替换查表_最全ASCII码对照表0-2
如何使用 ssh 建立 socks 代理
Typora配合PicGo阿里云图床配置
SoapUI、Jmeter、Postman三种接口测试工具的
github用相对路径显示图片_GitHub 中 readm
Windows编译g2o及其g2o viewer
解决jupyter notebook无法连接/ jupyter连接
Git恢复到之前版本
VScode常用快捷键
上一篇文章      下一篇文章      查看所有文章
加:2021-11-14 21:55:41  更:2021-11-14 21:57:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 20:37:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码