| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 网络协议 -> python爬虫01 -> 正文阅读 |
|
|
[网络协议]python爬虫01 |
1.爬虫的概念????????网络爬虫就是模拟客户端(主要是指浏览器)发送网络请求并接收请求响应,它是一种按照一定规则,自动抓取互联网信息的程序 2.爬虫的流程
1.获取一个url 2.向url发送请求,并获取响应(需要http协议) 3.如果从响应中获取url,则继续发送请求获取响应 4.如果从响应中提取数据,则将数据进行保存 3.HTTP和HTTPS的区别https比http更安全但是性能相对更低 http:超文本传输协议,默认端口号80 ????????超文本:指超过文本,不仅限于文本,还包括图片、音频、视频等文件 ????????传输协议:是指使用公用约定的固定格式来传递转换成字符串的超文本内容 https:http+SSL(安全套接字层),即带有安全套接字的超文本传输协议,默认端口号443 4.常见的请求头请求头 ? ? ? ? Host:域名 ? ? ? ? Connection:长链接 ? ? ? ? Upgrade-Insecure-Requests:升级为HTTPS请求 ? ? ? ? User-Agent:用户代理,提供系统信息和浏览器信息 ? ? ? ? Referer:页面跳转处,防盗链(图片/视频) ? ? ? ? Cookie:状态保持 |
|
|
| 网络协议 最新文章 |
| 使用Easyswoole 搭建简单的Websoket服务 |
| 常见的数据通信方式有哪些? |
| Openssl 1024bit RSA算法---公私钥获取和处 |
| HTTPS协议的密钥交换流程 |
| 《小白WEB安全入门》03. 漏洞篇 |
| HttpRunner4.x 安装与使用 |
| 2021-07-04 |
| 手写RPC学习笔记 |
| K8S高可用版本部署 |
| mySQL计算IP地址范围 |
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/29 21:10:38- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |