IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发工具 -> qq成员一览 -> 正文阅读

[开发工具]qq成员一览

前期准备

qq安装

自行访问qq官网下载并安装qq

python环境安装

访问python官网选择自己心仪的版本进行下载

懒得找的话, 可访问同版本python传送门: 3.7.9版本

ps: 由于临时使用, 这里不浪费篇幅解释python环境变量的配置

安装时注意
  1. 勾选pip安装
    一般默认勾选上了
    在这里插入图片描述
  2. 安装路径不建议安装在c盘, 安装时建议调整路径为心仪的路径
    在这里插入图片描述

代码依赖包下载

打开cmd, 逐行输入下列内容

快捷键: win+r, 输入"cmd", 回车

pip install selenium
pip install bs4
pip install pandas

chrome浏览器安装

百度一下, 你就知道

驱动下载

  1. 查看chrome版本, chrome浏览器访问 chrome://settings/help

    例如, 我这里的版本为: 94.0.4606.41

  2. 访问chromedriver, 下载对应版本的驱动
    在这里插入图片描述

开始

  1. 登陆qq

  2. 新建文件夹, 用于存放代码和结果

  3. 新建一个文本文件, 修改文件名为 “get_qq_num.py”

  4. 用记事本打开刚新建的文件, 复制粘贴以下代码

    from selenium import webdriver
    from bs4 import BeautifulSoup
    import time
    import datetime
    import os
    import pandas as pd 
    
    
    def save_data(driver):
        # 页面源码
        res = driver.page_source
        # 关闭浏览器
        driver.quit()
    
        # 用于暂存q号列表
        qq_num_list = []
        
        soup = BeautifulSoup(res,"lxml")
       
        html = soup.select("td")
        
        
        # 有无 <群标签>字段
        qq_age = html[ 2 * 10 + 6].text.replace("\t", "").replace("\n", "")
    
        # 无<群标签>
        if "年" in qq_age:  
            for i in range(5000):
                try:
                    qq_num_list.append(html[ i*10 + 4].text.replace("\t", "").replace("\n", ""))
                except:
                    break
                    
        # 有<群标签>
        if "年" not in qq_age:  
            for i in range(5000):
                try:
                    qq_num_list.append(html[ i*11 + 4].text.replace("\t", "").replace("\n", ""))
                except:
                    break
         
        now = datetime.datetime.today().strftime("%Y%m%d")
        # 新建文件夹 dataset_[yyyymmdd]
        try:  
            os.mkdir("dataset_" + now)
        except:
            pass 
    
        with open("./dataset_" + now[:8] + "/" + group_id + '.text', 'w') as f:
            f.write(",".join(qq_num_list))
            
       
    if __name__ == '__main__': 
        # 群号
        group_id = '123456789'
        driver = webdriver.Chrome() 
        driver.get(url='https://qun.qq.com/member.html#gid={}'.format(group_id) )
        time.sleep(10) 
        page_source_length = 0
        while page_source_length < len(driver.page_source):
            page_source_length = len(driver.page_source)
            # 滚动下拉
            driver.execute_script("var q=document.documentElement.scrollTop=100000")
            time.sleep(2.5)
            
        save_data(driver)
    
  5. 修改代码中的qq群号码, 保存修改

    示例代码暂时用123465789显示

  6. 解压前面下载好的驱动到当前文件夹, 文件夹内容如下:

    在这里插入图片描述

  7. 在cmd中输入 D:/Programs/Python/Python37/python.exe d:/test/get_qq_num.py

    1. 指令是 python安装路径爬虫文件所在路径
    2. 如何打开cmd, 可以参考前面提到的步骤
    3. 执行后, 会打开浏览器, 访问页面, 登陆抠抠授权, 这里不要怕, 并不是电脑中毒了
  8. 结果

    1. 当前文件夹下多了个文件夹dataset_[时间], 其中, 里面有个文件, 是群成员抠抠号码的文本信息(用,隔开)

拓展

获取群成员抠抠邮箱

  1. 复制粘贴上述获取到的抠抠号码文本信息

    这里不妨假设是 123,456

  2. 打开chrome, 点击键盘上的f12
    在这里插入图片描述
  3. 在上图所指位置输入以下内容
    "123,456".split(',').map(a=>${a}@qq.com).join(',')

    输入完记得按回车, 结果如下图
    在这里插入图片描述

改了自定义邮箱的, 恕鄙人能力有限, 无法获取

特别鸣谢

  1. 甲方大大
  开发工具 最新文章
Postman接口测试之Mock快速入门
ASCII码空格替换查表_最全ASCII码对照表0-2
如何使用 ssh 建立 socks 代理
Typora配合PicGo阿里云图床配置
SoapUI、Jmeter、Postman三种接口测试工具的
github用相对路径显示图片_GitHub 中 readm
Windows编译g2o及其g2o viewer
解决jupyter notebook无法连接/ jupyter连接
Git恢复到之前版本
VScode常用快捷键
上一篇文章      下一篇文章      查看所有文章
加:2022-04-18 18:03:22  更:2022-04-18 18:05:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/14 15:13:23-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码