[Python知识库] 猫眼top100电影爬取

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> 猫眼top100电影爬取 -> 正文阅读

[Python知识库]猫眼top100电影爬取

所需的库：re，time（防止猫眼检测成异常ip），requests

import time

import requests
import re


def run():
    url="https://www.maoyan.com/board/4?requestCode=3712207890bccddba4b4ca833e26c8e554rgr&offset={}"
    headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36"}
    num=0
    temp=1  #为了验证是否在跳转爬取信息
    while num<=90:
        response=requests.get(url=url.format(num),headers=headers)
        result=response.text

        obj=re.compile(r'<p class="name"><a href=".*?" title="(.*?)" .*?">.*?</a></p>',re.S)
        list_result=obj.findall(result)
        print(temp)
        for i in list_result:
            print(i,type(i))
            with open("maoyan_movie.txt",'a') as f:
                f.write(i)
                f.write('\n')
        time.sleep(1)
        num=num+10
        temp=temp+1

run()

Python知识库最新文章

Python中String模块

【Python】 14-CVS文件操作

python的panda库读写文件

使用Nordic的nrf52840实现蓝牙DFU过程

【Python学习记录】numpy数组用法整理

Python学习笔记

python字符串和列表

python如何从txt文件中解析出有效的数据

Python编程从入门到实践自学/3.1-3.2

python变量

加:2022-01-14 01:55:36 更:2022-01-14 01:55:56

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/26 3:11:47-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码