| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> requests库和bs4库的应用 -> 正文阅读 |
|
[Python知识库]requests库和bs4库的应用 |
1.requests模块: ?????????? 1.1)它是python中基于网络请求的模块,功能很强大,简单便捷,效率高。 2.如何使用:(requests模块的编码流程)
网页数据爬取
3.requests库: ?????????? 3.1)方法: ?????????? r=requests.get('url'):发送请求获取资源对象,并且返回资源对象 ?????????? requests.request(代码标签):构造请求???? ?????????? requests.head():获取网页头信息 ????? ????? 3.2)步骤: ?????????? ????? import requests:导入库 ?????????? ????? r=requests.get('url'):发送并返回请求资源对象 ?????????? ????? print(r.status_code):查看状态码 ?????????? ????? r.encoding:查看网页编码 ?????????? ????? r.apparent_encoding:根据网页内容评估的备用编码 ?????????? ???? r.text:查看整个网页的内容 ?????????? ???? r.encoding=r.apparent_encoding:将备用编码替换头编码 ?????????? ???? r.text[-500:] ?????????? ????? r.text[:1000] 数据的优化 ?????????? ????? from bs4 import BeautifuSoup ?????????? ????? soup=BeautifulSoup(文本/网页内容,'html.parser') ????? ???? ???? print(soup.prettify)
图片数据爬取 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/16 3:15:21- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |