网络基础知识
网络分层
网络分层从上到下分别是应用层、传输层、网络层、数据链路层和物理层,越靠下的层越接近硬件。
物理层
该层负责比特流在节点间的传输,即负责物理传输。该层的协议既与链路有关,也与传输介质有关。简单来说,就是把计算机连接起来的物理手段。
数据链路层
该层控制网络层与物理层之间的通信,其主要功能是如何在不可靠的物理线路上进行数据的可靠传递。为了保证传输,从网络层接收到的数据被分割成特定的可被物理层传输的帧。帧是用来移动数据的结构包,它不仅包括原始数据,还包括发送方和接收方的物理地址以及纠错和控制信息。其中的地址确定了帧将发送到何处,而纠错和控制信息则确保帧无差错到达。如果在传送数据时,接收点检测到所传数据中有差错,就要通知发送方重发这一帧。
网络层
该层决定如何将数据从发送方路由到接收方。网络层通过综合考虑发送优先权、网络拥塞程度、服务质量以及可选路由的花费来决定从一个网络中的节点A到另一个网络中节点B的最佳路径。
传输层
该层为两台主机上的应用程序提供端到端的通信。相比之下,网络层的功能是建立主机到主机的通信。传输层有两个传输协议:TCP(传输控制协议)和UDP(用户数据报协议)。其中,TCP是一个可靠的面向连接的协议,UDP是不可靠的或者说无连接的协议。
应用层
应用层是规定应用程序的数据格式的。它的主要协议有HTTP、FTP、Telnet、SMTP、POP3 等。
HTTP协议
概念
HTTP协议(HyperText Transfer Protocal)即:超文本传输协议,是一个属于应用层的面向对象的协议,是一个基于请求/响应模式的、无状态的协议。
特点
客户端向服务端发出请求时,只需传送请求方式和路径。请求方法常用的有GET、HEAD、POST,每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
允许传输任意类型的数据对象,由Content-Type加以标记。
无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。
HTTP协议是无状态协议,无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大;而另一方面,在服务器不需要先前信息时它的应答速度就较快。
HTTP版本
1.0 版本
默认非持续性:浏览器和服务器建立TCP连接后,只能请求一 个对象.
1.1 版本
默认持续性:浏览器和服务器建立TCP连接后,可以请求多个对象
HTTP URL 格式
http://host[":"port][abs_path]
表示要通过HTTP协议来定位网络资源
表示合法的Internet主机域名或者IP地址
指定一个端口号,为空则使用默认端口80
指定请求资源的URI
HTTP 请求报文
HTTP报文是面向文本的,报文中的每一个字段都是一些ASCII码串,各个字段的长度是不确定的。一般一个HTTP请求报文由请求行、请求报头、空行和请求数据部分组成。
请求行
请求行由请求方法、URL字段和HTTP协议的版本组成。
Method Request-URI HTTP-Version CRLF
请求方法
一个统一资源标识符
表示请求HTTP协议的版本
表示回车和换行
HTTP请求方法:
- GET : 请求获取Request-URI所标识的资源
- POST: 在Request-URI所标识的资源后附加新的数据
- HEAD: 请求获取由Request-URI所标识的资源的响应消息报头
- PUT: 请求服务器存储一个资源,并用 Request-URI作为其标识
- DELETE: 请求服务器删除Request-URI所标识的资源
- TRACE: 请求服务器回送收到的请求信息,主要用于测试或诊断
- CONNECT: HTTP 1.1 希望以中预留能够将连接改为管道方式的代理服务器
- OPTIONS: 请求查询服务器的性能,或者查询与资源相关的选项和需求
GET 方法和POST 方法区别
区别 | GET | POST |
---|
安全 | 参数拼成URL,放到header请求头里传递 | 以键值对的形式放到请求体中传递 | 传输量 | 有大小限制,不能大于2KB | 无大小限制 | 效率 | 高 | 低 |
请求报头
在请求行之后会有0个或者多个请求报头,每个请求报头都包含一个名字和一个值,它们之间用“:”分割。请求头部会以一个空行,发送回车符和换行符,通知服务器以下不会有请求头
请求数据
请求数据不在GET方法中使用,而是在POST方法中使用。POST方法适用于需要客户填写表单的场合,与请求数据相关的最常用的请求头是Content-Type和Content-Length。
HTTP的响应报文
HTTP的响应报文由状态行、消息报头、空行、响应正文组成
响应报文格式:
格式:
HTTP-Version Status-Code Reason-Phrase CRLF
表示服务器HTTP协议的版本
表示服务器发回的响应状态代码
表示状态代码的文本描述
状态代码:
- 100~199:指示信息,表示请求已接收,继续处理
- 200~299:请求成功,表示请求已被成功接收、理解、接受
- 300~399:重定向,要完成请求必须进行更进一步的操作
- 400~499:客户端错误,请求有语法错误或请求无法实现
- 500~599:服务器端错误,服务器未能实现合法的请求
常见的状态码:
- 200 OK:客户端请求成功
- 400 Bad Request:客户端请求有语法错误,不能被服务器所理解
- 401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
- 403 Forbidden:服务器收到请求,但是拒绝提供服务
- 500 Internal Server Error:服务器发生不可预期的错误
- 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常
HTTP的消息报头
消息报头分为通用报头、请求报头、响应报头、实体报头等。消息头由键值对组成,每行一对,关键字和值用英文冒号“:”分隔。
通用报头
既可以出现在请求报头,也可以出现在响应报头中。
- Date:表示消息产生的日期和时间
- Connection:允许发送指定连接的选项,例如指定连接是连续的,或者指定“close”选项,通知服务器,在响应完成后,关闭连接。
- Cache-Control:用于指定缓存指令,缓存指令是单向的(响应中出现的缓存指令在请求中未必会出现),且是独立的(一个消息的缓存指令不会影响另一个消息处理的缓存机制)。
请求报头
请求报头通知服务器关于客户端的信息,典型的请求头有:
- Host:请求的主机名,允许多个域名同处一个IP地址,即虚拟主机
- User-Agent:发送请求的浏览器类型、操作系统等信息
- Accept:客户端可识别的内容类型列表,用于指定客户端接收那些类型的信息
- Accept-Encoding:客户端可识别的数据编码
- Accept-Language:表示浏览器所支持的语言类型
- Connection:允许客户端和服务器指定与请求/响应连接有关的选项,例如这是为Keep-Alive则表示保持连接。
- Transfer-Encoding:告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式。
响应报头
用于服务器传递自身信息的响应,常见的响应报头:
- Location:用于重定向接受者到一个新的位置,常用在更换域名的时候
- Server:包含可服务器用来处理请求的系统信息,与User-Agent请求报头是相对应的
实体报头
实体报头用来定于被传送资源的信息,既可以用于请求也可用于响应。请求和响应消息都可以传送一个实体,常见的实体报头为:
- Content-Type:发送给接收者的实体正文的媒体类型
- Content-Lenght:实体正文的长度
- Content-Language:描述资源所用的自然语言,没有设置则该选项则认为实体内容将提供给所有的语言阅读
- Content-Encoding:实体报头被用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得Content-Type报头域中所引用的媒体类型,必须采用相应的解码机制。
- Last-Modified:实体报头用于指示资源的最后修改日期和时间
- Expires:实体报头给出响应过期的日期和时间
HTTP缓存知识
Request缓存相关首部字段
cache-control(用来做缓存过期判断)
常用的指令值:
- max-age:这个参数告诉浏览器将页面缓存多长时间,超过这个时间后才再次向服务器发起请求检查页面是否有更新。缓存过期时间,是一个时间数值(单位:秒)。设置为0的时候效果等同于no-cache。
- no-cache:不做缓存。
- s-maxage:这个参数告诉缓存服务器的缓存页面的时间。如果不单独指定,缓存服务器将使用max-age。
- only-if-cached:若有缓存,则只使用缓存。
- private/public:默认是private,只在一个浏览器中缓存,设置为public时缓存可被多个用户共享
- max-stale:指示客户机可以接收超出超时期间的响应消息。
Pragma(用来做缓存过期判断)
它可以取值no-cache,当它和cache-control同时存在的时候,会被cache-control覆盖.
if-match/if-none-match(用来做资源更新判断)
会把缓存中的Etag传给服务器,服务器用它来和服务器端的资源Etag进行对比,若不一致则证明资源被修改了.
if-modified-since
会把文件的上一次缓存中的文件的更新时间传给服务器,服务器判断文件在这个时间点后是否被修改.
Response缓存相关首部字段
cache-control(用来设置缓存过期时间)
取值和Request 一样
Etag
用来设置根据资源内容生成的实体标签.
age
用来告诉客户端,这个response是在多久前被创建的(单位为秒),缓存服务器返回资源的时候必须创建此字段.
last-modified-time
用来设置资源最后修改时间
注意:只有get请求会被缓存,post请求不会
|