| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 开发测试 -> 使用wireshark抓取聊天信息与爬虫入门 -> 正文阅读 |
|
[开发测试]使用wireshark抓取聊天信息与爬虫入门 |
作者:token keyword |
文章目录1、聊天准备????1、关闭计算机的防火墙 ????2、关闭不需要的虚拟网络和其他不必要的以太网,只留下一个网络聊天的通道 ????3、两台计算机连接同一个手机热点,打开疯狂聊天程序 2聊天并进行抓包2.1、疯狂聊天????1、首先为自己命名一个聊天昵称,并且两台计算机(也可以多台计算机一起)输入同一个聊天房间号 ????2、进行消息的发送,即聊天 2.2、使用wireshark抓取聊天信息????1、打开wireshark,进行wlan(无线网络)下的聊天信息抓取,不会的可参考:https://blog.csdn.net/qq_46689721/article/details/121167497 ????3、查找Destination为255.255.255.255的记录 ????5、查看数字聊天信息 ????6、查看文字聊天信息 ????7、通过上面抓取结果来看,聊天使用的端口为17345,使用的协议是UDP 2、初识网络爬虫2.1、什么是爬虫????1、简介:网络爬虫也叫作网络蜘蛛、网络蚂蚁、网络机器人等,其英文名叫Web Crawler或Web Spider,可以自动地浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则去浏览,这些规则我们将其称为网络爬虫算法。使用Python可以很方便地编写出爬虫程序,进行互联网信息的自动化检索。 ????2、爬虫的基本流程:发起请求:通过url向服务器发起request请求,请求可以包含额外的header信息。获取响应内容:如果服务器正常响应,那我们将会收到一个response,response即为我们所请求的网页内容,或许包含HTML,Json字符串或者二进制的数据(视频、图片)等。 ????3、URL管理模块:发起请求。一般是通过HTTP库,对目标站点进行请求。等同于自己打开浏览器,输入网址。 2.2、爬取南阳理工学院ACM题目网站信息????1、打开南阳理工学院ACM题目网站 http://www.51mxd.cn/ ,然后按下F12进入工作模式,点击source,可以看到网页的源代码,这时可以看到我们需要的题目信息是在TD标签内的,即我们要爬取TD标签里的内容 ????2、我使用的是jupyter,打开进去使用python编程
????3、然后运行程序 ????4、查看生成的爬取数据 2.3、爬取重庆交通大学新闻网站中近几年所有的信息通知????1、打开重庆交通大学的信息通知网站:http://news.cqjtu.edu.cn/xxtz.htm ????2、同样F12打开进入开发者模式,在emelents下可以找到网页源代码,可以看到我们需要爬取的信息处于div标签内 ????3、再找到需要爬取的数据的页数
????5、运行代码 ????6、爬取到的数据 3、总结????刚刚接触爬虫,还不是非常的熟悉,但是同参考网上的资料,还是能够做到一些简单信息的爬取。对网站的信息爬取首先需要分析网站的源代码,进行爬取信息的分析,找到其属于的标签内容,然后进行爬取。通过本次的实践操作,我意识到爬虫对我们的帮助还是很大的,可以很好的帮我们随机信息。 参考: |
|
开发测试 最新文章 |
pytest系列——allure之生成测试报告(Wind |
某大厂软件测试岗一面笔试题+二面问答题面试 |
iperf 学习笔记 |
关于Python中使用selenium八大定位方法 |
【软件测试】为什么提升不了?8年测试总结再 |
软件测试复习 |
PHP笔记-Smarty模板引擎的使用 |
C++Test使用入门 |
【Java】单元测试 |
Net core 3.x 获取客户端地址 |
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/18 4:39:16- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |