几年前的时候,我还不会使用爬虫,曾经在“超级小桀”的直播间看到过小桀做出了一种非常厉害的积分系统。只要在他的直播间发送弹幕,就能参与竞猜。当时我觉得这太厉害了,这到底是怎么做到的呢。后来直到自己也真正学会使用了爬虫,才发现,当初看起来非常厉害的东西,不过就只是爬取斗鱼的弹幕罢了,如今的我也是可以轻松实现的。这大概就是当你近距离观察的时候,美感就消失了。我不再会觉得当初我崇拜的东西有那么厉害和神秘,这大概就是因为成长而失去。
好吧,说正经的,到底如何爬取斗鱼的弹幕呢?
正常的方法在网上已经有很多人写过了。斗鱼弹幕的服务器是一种tcp协议,你只需要和弹幕服务器建立连接,然后获取数据就可以了。
python爬取斗鱼弹幕_【Python3爬虫】斗鱼弹幕爬虫_weixin_39611031的博客-CSDN博客在网上找到了一份斗鱼弹幕服务器第三方接入协议v1.6.2,有了第三方接口,做起来就容易多了。一、协议分析斗鱼后台协议头设计如下:这里的消息长度是我们发送的数据部分的长度和头部的长度之和,两个消息长度是一样。然后要注意的是该协议使用的是小端整数,所以我们要对数据进行处理后再发送,这里可以使用int.to_bytes()将整数转变成小端整数的形式。示例如下:int.to_bytes(12,4,'lit...https://blog.csdn.net/weixin_39611031/article/details/111018177
比如说,csdn上这位博主就已经写的很好了。所以说,如果你真的想爬取斗鱼弹幕,这并不是一件困难的事情。
除此之外,如果你不想和弹幕服务器建立连接的话,去监听直播间的页面的网页变化也是可以的。正常来说,如果你在网页版登录斗鱼,然后每当从弹幕服务器获取弹幕以后,都会对网页进行修改,这样我们才能在网页上看到,因此,直接去监听网页的变化,也是一种思路。但是肯定没有直接连接弹幕服务器那么好。
?比如说,我们尝试爬取一下2021-09-10 21:18时候,英雄联盟手游赛事的直播间
第二把多少时间
斗鱼真够大气的,一千鱼丸
瞎子?
怎么买怎么输一下午没赢一把
打脸啪啪
难道不是瑞文
看腿
我结束了,你们呢
刚刚没看,第二把多少时间
这女的是谁
腿好好看
吊大说一下
还是这个熟悉的进面地板 ? 今天什么色内裤
现在回想起来,以前用到过的什么xx弹幕提示助手,大概也是类似的功能吧
|