IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 二十行Python代码,带你了解扣扣发生大规模账号泄露前因后果 -> 正文阅读

[Python知识库]二十行Python代码,带你了解扣扣发生大规模账号泄露前因后果

嗨害大家好鸭,我是小熊猫🖤

六月,秋秋发生大规模盗号事件,众说纷纭,

也有说因为某习通买卖个人信息导致的,

有说是因为点了图片中的网站导致中毒被盗的,

还有说企鹅数据库被攻击导致账号被盗的,

反正公说公有理婆说婆有理。

请添加图片描述
但是吧,人呐,一般都喜欢凑热闹,

于是乎,我直接用Python把围脖爬了一遍,

看他们争论的不亦乐乎,我开心极了~

有什么python相关报错解答自己不会的、或者源码资料/模块安装/女装大佬精通技巧 都可以来这里:(https://jq.qq.com/?_wv=1027&k=2Q3YTfym)或者文末私号问我

请添加图片描述

准备工作

使用的是Python3.8 和 pycharm 编辑器,

为什么我用的是3.8 而不是最新版呢?

很多刚开始学Python的兄弟喜欢下载新版本,

在原有的认知里面就是觉得最新的自然就是最好的,

但是,对于软件而言,越新的版本,问题越多,不稳定,

还需要不断地修改不断地完善。

打个简单的比方,以LOL为例,

每次版本刚更新,总是会爆出一些小bug,

然后收集一段时间后,再通过小版本或者直接在线就更新了。

所以说软件并不是版本越新越好,

这里我推荐的是Python3.8,目前最稳定的版本。

pycharm的话,

pycharm2020以前的版本是没有中文版插件的,

只能通过在网上找的插件安装,

后面的版本都可以直接在pycharm上安装插件。

有什么python相关报错解答自己不会的、或者源码资料/模块安装/女装大佬精通技巧 都可以来这里:(https://jq.qq.com/?_wv=1027&k=2Q3YTfym)或者文末私号问我

代码展示

import pprint
import re
import requests
import csv
import pandas as pd
python学习交流群:660193417###

# f = open('微博评论.csv', mode='a', encoding='utf-8', newline='')
# csv_writer = csv.DictWriter(f, fieldnames=[
#     '用户',
#     '地区',
#     '评论',
#     '日期',
# ])
# csv_writer.writeheader()


url = 'https://m.***.cn/comments/hotflow?id=4784937075214225&mid=4784937075214225&max_id_type=0'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

lis = []
for index in response.json()['data']['data']:
    content = ''.join(re.findall('[\u4e00-\u9fa5]+', index['text']))
    dit = {
        '用户': index['user']['screen_name'],
        '地区': index['source'].replace('来自', ''),
        '评论': content,
        '日期': index['created_at']
    }
    lis.append(dit)
    # csv_writer.writerow(dit)
    print(dit)

pd_data = pd.DataFrame(lis)
pd_data.to_excel('微博评论.xlsx')
python学习交流群:660193417###

效果

部分数据

请添加图片描述
大家还可以自己试试做做词云图,爬取多页等等刚操作!

快去试试吧~

我是小熊猫, 咱下篇文章再见(????)

在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-07-17 16:19:02  更:2022-07-17 16:21:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 1:28:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计