HTTP-HTTP协议结构和通讯原理(二)
一、HTTP协议特点
1.支持客户/服务器模式(C/S)
? 客户/服务器模式工作的方式是由客户端向服务器发出请求,服务器响应请求,并进行相应服务。
2.简单快速
- 客户向服务器请求服务时,只需传送请求方法和路径
- 请求方法常用的有GET、HEAD、POST,每种方法规定了客户与服务器联系的类型不同
- 由于HTTP协议简单,使得HTTP服务器的程序规模小,因为通讯速度很快
3.灵活
- HTTP允许传输任意类型的数据对象
- 正在传输的类型由Content-Type加以标识
4.无连接
- 限制每次连接只处理一个请求
- 服务器处理完客户的请求,并收到客户的应答后,即断开连接(短连接)
- 采用这种方式可以节省传输时间
5.无状态
- 协议对于事务,缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大
- 另外一方面,在服务器不需要先前信息时它的应答就较快
二、HTTP报文结构分析
1.请求报文
? 请求报文由请求行、请求头和请求体构成,如下图:
2.HTTP报文头
? HTTP报文头大体可以分为四类,分别是:通用报文头、请求报文头、响应报文头和实体报文头
2.1 通用报文头
首部字段名 | 说明 |
---|
Cache-Control | 控制缓存的行为 | Connection | 逐跳首部、连接的管理 | Date | 创建报文的日期时间 | Pragma | 报文指令 | Trailer | 报文末端的首部一览 | Transfer-Encoding | 指定报文主题的传输编码方式 | Upgrade | 升级为其他协议 | Via | 代理服务器的相关信息 | Warning | 错误通知 |
2.2 请求报文头
首部字段名 | 说明 |
---|
Accept | 用户代理可处理的媒体类型 | Accept-Charset | 优先的字符集 | Accept-Encoding | 优先的内容编码 | Accept-Language | 优先的语言 | Authorization | Web认证信息 | Host | 请求资源所在服务器 | Range | 实体的字节范围请求 | User-Agent | HTTP客户端程序的信息 |
2.3 响应报文头
首部字段名 | 说明 |
---|
Accept-Ranges | 是否接受字节范围请求 | Age | 推算资源创建经过时间 | Location | 重定向的URL |
2.4 实体报文头
首部字段名 | 说明 |
---|
Allow | 资源可支持的HTTP方法 | Content-Encoding | 实体主体适用的编码方式 | Content-Language | 实体主体的自然语言 | Content-Length | 实体主体的大小(单位:字节) | Content-Location | 替代对应资源的URI | Content-Range | 实体主体的位置范围 | Expires | 实体主体过期的日期时间 |
3.响应报文
? 响应报文由响应行、响应头和响应体构成,如下图:
三、HTTP请求方法剖析
1.GET请求
- GET方法用来请求访问已被URI识别的资源
- 指定的资源经服务器端解析后返回响应内容
- 传输的数据会直接拼接在URI之后,并且URI的长度是有限制的,所以使用GET方法传输数据时,其数据大小会被限制
- 使用GET请求提交数据,会使用明文传输
2.POST方法
- POST方法与GET功能类似,一般用来传输实体的主体
- POST方法的主要目的不是获取响应主体的内容
- POST方法提交数据是经过编码之后进行传输
- POST方法提交数据没有大小限制
3.PUT
- 从客户端向服务器传送的数据取代指定的文档的内容
- PUT方法与POST方法最大的不同是:PUT是幂等的,而POST是不幂等的
4.HEAD
- 类似于GET方法,只不过返回的响应体中没有具体的内容,用于获取报文头
5.DELETE
6.OPTIONS
7.CONNECT
- 开启一个客户端与所请求资源之间的双向沟通的通道,它可以用来创建隧道
四、响应状态码
分类 | 含义 |
---|
1XX | 表示消息。这一类型的状态码,代表请求已被接受,需要继续处理,这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。 | 2XX | 表示成功。这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。 | 3XX | 表示重定向。这类状态码代表需要客户端采取进行重定向,后续的请求地址(重定向目标)在本次响应的Location域中表明。 | 4XX | 表示请求错误。这类状态码代表了客户端发生的一些错误,比如请求资源不存在。 | 5XX | 表示服务器错误。这类状态码代表了服务器内部发生的一些错误。 |
1. 2XX
状态码 | 描述 |
---|
200 | 请求成功,请求数据已返回 | 202 | 已接受请求,但未处理完成 | 206 | 当客户端请求部分数据时,会加上range头,服务器会返回206状态码 |
2. 3XX
状态码 | 描述 |
---|
301 | 永久移动,请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替。 | 302 | 临时移动,与301类似,但资源只是临时被移动,客户端应继续使用原有URI |
3. 4XX
状态码 | 描述 |
---|
400 | 客户端请求的语法错误,服务器无法理解 | 401 | 请求要求用户的身份认证 | 403 | 服务器理解请求客户端的请求,但是拒绝执行此请求 | 404 | 服务器无法根据客户端的请求找到资源 |
4. 5XX
状态码 | 描述 |
---|
500 | 服务器内部错误,无法完成请求 | 502 | 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求 |
五、Cookie和Session
? 由于HTTP协议是无状态协议,所以为了弥补这一缺点,就有了cookie和session用来进行状态管理。
1.Cookie
- Cookie是一小段的文本信息,客户端请求服务器,如果服务器需要记录该用户状态,就向客户端浏览器颁发一个Cookie
- 客户端浏览器会把Cookie保存起来,当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器,服务器检查该Cookie,以此来辨认用户信息
2.Session
- Session是另一种记录客户状态的机制,保存在服务器上。客户端浏览器访问服务器时,服务器把客户端信息以某种形式记录在服务器上
- 客户端浏览器再次访问时只需要从该Session中查找客户的状态就可以了
3.保存sessionId的方式
- Cookie:一般会使用cookie-session的方式进行HTTP状态管理
- 在服务器生成唯一的SessionId,并且将SessionId作为key,用户信息作为value存入session中
- 将SessionId作为cookie的value存入cookie中
- 当后续请求时,cookie会携带上次存进去的数据,服务器对cookie携带的sessionId进行验证,若服务器存在这个sessionId,则验证成功
- URL重写:目前的浏览器一般都支持Cookie,但Cookie可以被用户禁用,一旦被禁用,cookie-session就无法使用,所以也可以选择URL重写的方法进行HTTP状态管理
- 使用URL参数:可以将sessionId放入到URL参数后进行传递
- 拼接URL:将sessionId拼接到URL中,当作是URL的一部分
4.Cookie和Session的区别
- 存放位置不同:Cookie存放在客户端浏览器中,而Session存放在服务器中
- 安全性不同:Cookie存放在浏览器中,用户可以查看、删除、甚至修改Cookie,而Session存放在服务器,用户一般是无法得到session的,所以cookie中一般不存敏感信息
- 有效期的不同:Cookie的过期时间可以设置很长时间,甚至不失效,而Session由于存在于服务器,Session存的多了会对服务器有一定的压力,所以需要定期清除Session
|