[Python知识库] python爬校花网笔记

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> python爬校花网笔记 -> 正文阅读

[Python知识库]python爬校花网笔记

import requests
import re  #正则表达式
from bs4 import BeautifulSoup #爬虫bs4
import os
#爬高考校花网
def xiaohua():
    url="http://www.gaokao.com/gkpic/"
    response=requests.get(url) #get请求网址
    response.encoding="GBK" #编码为gbk，以免中文乱码
    html=response.text  #用变量接收响应的文本信息
    file=BeautifulSoup(html,'html.parser') #定义一个bs4方法
    img=file.find(name='div',attrs={'id':'imgall'})  #使用定义的方法查找出所有div标签下 的图片路径
    #使用正则表达式提取所有校花图片url，注意后面形参要是str格式
    imagelist=re.findall('src="(.*?)"/>',str(img))
    #print(imagelist)
    #定义存储图片路径，如果不存在就创建一个，os为系统命令
    dir='校花'
    if not os.path.exists(dir):
        os.mkdir(dir)
    for image in imagelist:
        #定义图片名为.jpg前面的字符，截取方法
        tpm=image.split('/')[-1]
        #循环请求图片url
        res=requests.get(image)
        #with open 方法将图片写入dir目录
        with open (dir+'/'+tpm,'wb') as f:
            f.write(res.content)



if __name__ == '__main__':

    xiaohua()

Python知识库最新文章

Python中String模块

【Python】 14-CVS文件操作

python的panda库读写文件

使用Nordic的nrf52840实现蓝牙DFU过程

【Python学习记录】numpy数组用法整理

Python学习笔记

python字符串和列表

python如何从txt文件中解析出有效的数据

Python编程从入门到实践自学/3.1-3.2

python变量

加:2021-08-02 10:46:25 更:2021-08-02 10:47:12

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/1 12:22:37-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码