在?试过程中,HTTP 被提问的概率还是?较?的。 我搜集了 5 ?类 HTTP ?试常问的题?,同时这 5 ?类题跟 HTTP 的发展和演变 关联性是?较?的,通过问答 + 图解 的形式由浅?深 的?式帮助?家进?步的学习和理解 HTTP 。
- HTTP 基本概念
- Get 与 Post
- HTTP 特性
- HTTPS 与 HTTP
- HTTP/1.1、HTTP/2、HTTP/3 演变
【tip】:篇幅虽长,但是耐心看完一定对你帮助很大
一、HTTP基本概念
HTTP 是什么?描述?下
HTTP 是超?本传输协议,也就是HyperText Transfer Protocol。
能否详细解释「超?本传输协议」?
HTTP的名字「超?本协议传输」,它可以拆成三个部分:
- 超?本
- 传输
- 协议
1. 「协议」
在?活中,我们也能随处可?「协议」,例如: 刚毕业时会签?个「三?协议」; 找房?时会签?个「租房协议」; ?活中的协议,本质上与计算机中的协议是相同的,协议的特点:
- 「协」字,代表的意思是必须有
两个以上的参与者 。例如三?协议?的参与者有三个:你、公司、学校三 个;租房协议?的参与者有两个:你和房东。 - 「议」字,代表的意思是对参与者的?种
?为约定和规范 。例如三?协议?规定试?期期限、毁约?等;租 房协议?规定租期期限、每?租??额、违约如何处理等。
针对 HTTP 协议 ,我们可以这么理解。 HTTP 是?个?在计算机世界?的协议 。它使?计算机能够理解的语?确?了?种计算机之间交流通信的规范(两 个以上的参与者 ),以及相关的各种控制和错误处理?式(?为约定和规范 )。
2. 「传输」
所谓的「传输」,很好理解,就是把?堆东?从 A 点搬到 B 点,或者从 B 点 搬到 A 点。 别轻视了这个简单的动作,它?少包含两项?要的信息。 HTTP 协议是?个双向协议 。
我们在上?冲浪时,浏览器是请求? A ,百度?站就是应答? B。双?约定? HTTP 协议来通信,于是浏览器把请 求数据发送给?站,?站再把?些数据返回给浏览器,最后由浏览器渲染在屏幕,就可以看到图?、视频了。 数据虽然是在 A 和 B 之间传输,但允许中间有中转或接? 。
就好像第?排的同学想传递纸条给最后?排的同学,那么传递的过程中就需要经过好多个同学(中间?),这样的传输?式就从「A < — > B」,变成了「A <-> N <-> M <-> B」。
?在 HTTP ?,需要中间?遵从 HTTP 协议,只要不打扰基本的数据传输,就可以添加任意额外的东?。
针对传输 ,我们可以进?步理解了 HTTP。 HTTP 是?个在计算机世界?专??来在两点之间传输数据 的约定和规范。
3. 「超文本」
HTTP 传输的内容是「超?本」。 我们先来理解「?本」,在互联?早期的时候只是简单的字符?字,但现在「?本」的涵义已经可以扩展为图?、视频、压缩包等,在 HTTP 眼?这些都算作「?本」。
再来理解「超?本」,它就是超越了普通?本的?本 ,它是?字、图?、视频等的混合体,最关键有超链接,能从?个超?本跳转到另外?个超?本。
HTML 就是最常?的超?本了,它本身只是纯?字?件,但内部?很多标签定义了图?、视频等的链接,再经过浏览器的解释,呈现给我们的就是?个?字、有画?的??了。
OK,经过了对 HTTP ?这三个名词的详细解释,就可以给出?「超?本传输协议」这七个字更准确更有技术含量的答案:
HTTP 是?个在计算机世界里专门在「两点」之间「传输」?字、图?、?频、视频等「超?本」数据的「约定和规范」。
那「HTTP 是?于从互联?服务器传输超?本到本地浏览器的协议 ,这种说法正确吗?
这种说法是不正确 的。因为也可以是「服务器< – >服务器」,所以采?两点之间 的描述会更准确。
HTTP 常?的状态码,有哪些?
【这里就不再展开了,如果想查看具体状态码含义,请阅读我下面几篇博客。】
http 常?字段有哪些?
1. Host字段
客户端发送请求时,?来指定服务器的域名。 Host: www.A.com 有了 Host 字段,就可以将请求发往「同?台」服务器上的不同?站。
2. Content-Length 字段
服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据?度。 Content-Length: 1000
如上?则是告诉浏览器,本次服务器回应的数据?度是 1000 个字节,后?的字节就属于下?个回应了。
3. Connection 字段
Connection 字段最常?于客户端要求服务器使? TCP 持久连接,以便其他请求复?。 【注意】:HTTP/1.1 版本的默认连接都是持久连接,但为了兼容?版本的 HTTP,需要指定 Connection ?部字段的值为Keep-Alive 。
Connection: keep-alive
?个可以复?的 TCP 连接就建?了,直到客户端或服务器主动关闭连接。但是,这不是标准字段。
4. Content-Type 字段
Content-Type 字段?于服务器回应时,告诉客户端,本次数据是什么格式。 Content-Type: text/html; charset=utf-8
上?的类型表明,发送的是??,?且编码是UTF-8。
客户端请求的时候,可以使? Accept 字段声明??可以接受哪些数据格式。
Accept: * / *
上?代码中,客户端声明??可以接受任何格式的数据。
5. Content-Encoding 字段
Content-Encoding 字段说明数据的压缩?法。表示服务器返回的数据使?了什么压缩格式 Content-Encoding: gzip
上?表示服务器返回的数据采?了 gzip ?式压缩,告知客户端需要?此?式解压。
Accept-Encoding: gzip, deflate 客户端在请求时,? Accept-Encoding 字段说明??可以接受哪些压缩?法。
二、GET与POST
说?下 GET 和 POST 的区别?
Get ?法的含义是请求从服务器获取资源 ,这个资源可以是静态的?本、??、图?视频等。 ?如,你打开我的?章,浏览器就会发送 GET 请求给服务器,服务器就会返回?章的所有?字及资源。
? POST ?法则是相反操作,它向URI 指定的资源提交数据 ,数据就放在报?的 body ?。
?如,你在我?章底部,敲?了留?后点击「提交」,浏览器就会执??次 POST 请求,把你的留??字放进了报? body ?,然后拼接好 POST 请求头,通过 TCP 协议发送给服务器。
GET 和 POST ?法都是安全和幂等的吗?
先说明下安全和幂等的概念:
- 在 HTTP 协议?,所谓的「安全」是指请求?法不会「破坏」服务器上的资源。
- 所谓的「幂等」,意思是多次执?相同的操作,结果都是「相同」的。
那么很明显 GET ?法就是安全且幂等的 ,因为它是「只读」 操作,?论操作多少次,服务器上的数据都是安全的,且每次的结果都是相同的。
POST 因为是「新增或提交数据」的操作,会修改服务器上的资源,所以是不安全 的,且多次提交数据就会创建多个资源,所以不是幂等 的。
三、HTTP特征
你知道的 HTTP(1.1) 的优点有哪些,怎么体现的?
HTTP 最凸出的优点是「简单、灵活和易于扩展、应??泛和跨平台」。
1. 简单
HTTP 基本的报?格式就是header + body ,头部信息也是 key-value 简单?本的形式,易于理解 ,降低了学习和使?的?槛。
2. 灵活和易于扩展
HTTP协议?的各类请求?法、URI/URL、状态码、头字段等每个组成要求都没有被固定死,都允许开发?员?定义和扩充 。 同时 HTTP 由于是?作在应?层( OSI 第七层),则它下层可以随意变化 。 HTTPS 也就是在 HTTP 与 TCP 层之间增加了 SSL/TLS 安全传输层,HTTP/3 甚?把 TCP 层换成了基于 UDP 的QUIC。
3. 应??泛和跨平台
互联?发展?今,HTTP 的应?范围?常的?泛,从台式机的浏览器到?机上的各种 APP,从看新闻、刷贴吧到购物、理财、吃鸡,HTTP 的应??地开花 ,同时天然具有跨平台 的优越性。
那它的缺点呢?
HTTP 协议?有优缺点?体的双刃剑 ,分别是「?状态、明?传输」 ,同时还有??缺点「不安全」。
1. ?状态双刃剑
?状态的好处 ,因为服务器不会去记忆 HTTP 的状态,所以不需要额外的资源来记录状态信息,这能减轻服务器的负担,能够把更多的 CPU 和内存?来对外提供服务。
?状态的坏处 ,既然服务器没有记忆能?,它在完成有关联性的操作时会?常麻烦。 例如登录->添加购物?->下单->结算->?付,这系列操作都要知道?户的身份才?。但服务器不知道这些请求是有关联的,每次都要问?遍身份信息。
这样每操作?次,都要验证信息,这样的购物体验还能愉快吗?别问,问就是酸爽! 对于?状态的问题,解法?案有很多种,其中?较简单的?式? Cookie 技术。 Cookie 通过在请求和响应报?中写? Cookie 信息来控制客户端的状态。
相当于,在客户端第?次请求后,服务器会下发?个装有客户信息的「?贴纸」,后续客户端请求服务器的时候,带上「?贴纸」,服务器就能认得了了。
2. 明?传输双刃剑
明?意味着在传输过程中的信息,是可?便阅读的,通过浏览器的 F12 控制台或 Wireshark 抓包都可以直接?眼查看,为我们调试?作带了极?的便利性。
但是这正是这样,HTTP 的所有信息都暴露在了光天化?下,相当于信息裸奔 。在传输的漫?的过程中,信息的内容都毫?隐私可?,很容易就能被窃取,如果??有你的账号密码信息,那你号没了 。 3. 不安全
HTTP ?较严重的缺点就是不安全:
- 通信使?明?(不加密),内容可能会被窃听。?如,
账号信息容易泄漏 ,那你号没了。 - 不验证通信?的身份,因此有可能遭遇伪装。?如,访问
假的淘宝、拼多多 ,那你钱没了。 - ?法证明报?的完整性,所以有可能已遭篡改。?如,
??上植?垃圾?告 ,视觉污染,眼没了。
HTTP 的安全问题,可以? HTTPS 的?式解决,也就是通过引? SSL/TLS 层,使得在安全上达到了极致。 【补】:https会在后面几篇博客讲
那你再说下 HTTP/1.1 的性能如何?
HTTP 协议是基于TCP/IP ,并且使?了「请求 - 应答」 的通信模式,所以性能的关键就在这两点 ?。
1. 长连接
早期 HTTP/1.0 性能上的?个很?的问题,那就是每发起?个请求,都要新建?次 TCP 连接(三次握?),?且是串?请求,做了?谓的 TCP 连接建?和断开,增加了通信开销。
为了解决上述 TCP 连接问题,HTTP/1.1 提出了?连接的通信?式 ,也叫持久连接 。这种?式的好处在于减少了TCP 连接的重复建?和断开所造成的额外开销,减轻了服务器端的负载。
持久连接的特点是,只要任意?端没有明确提出断开连接,则保持 TCP 连接状态。 2. 管道?络传输
HTTP/1.1 采?了?连接的?式,这使得管道(pipeline)?络传输成为了可能。
即可在同?个 TCP 连接??,客户端可以发起多个请求,只要第?个请求发出去了,不必等其回来 ,就可以发第?个请求出去,可以减少整体的响应时间 。
举例来说,客户端需要请求两个资源。以前的做法是,在同?个TCP连接??,先发送 A 请求,然后等待服务器做出回应,收到后再发出 B 请求。管道机制则是允许浏览器同时发出 A 请求和 B 请求。 但是服务器还是按照顺序 ,先回应 A 请求,完成后再回应 B 请求。要是前?的回应特别慢,后?就会有许多请求排队等着。这称为「队头堵塞」 。
3. 队头阻塞
「请求 - 应答」的模式加剧了 HTTP 的性能问题。
因为当顺序发送的请求序列中的?个请求因为某种原因被阻塞时,在后?排队的所有请求也?同被阻塞了,会招致客户端?直请求不到数据,这也就是「队头阻塞」。好?上班的路上塞? 。
四、HTTP与HTTPS
HTTP 与 HTTPS 有哪些区别?
- HTTP 是超?本传输协议,信息是明?传输,存在安全?险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在TCP 和 HTTP ?络层之间加?了 SSL/TLS 安全协议,使得报?能够加密传输。
- HTTP 连接建立相对简单, TCP 三次握?之后便可进行 HTTP 的报?传输。而HTTPS 在 TCP 三次握?之后,还需进行 SSL/TLS 的握?过程,才可进?加密报?传输。
- HTTP 的端?号是 80,HTTPS 的端口号是 443。
- HTTPS 协议需要向 CA(证书权威机构)申请数字证书,来保证服务器的身份是可信的。
HTTPS 解决了 HTTP 的哪些问题?
HTTP 由于是明?传输,所以安全上存在以下三个?险
窃听?险 ,?如通信链路上可以获取通信内容,?户号容易没。篡改?险 ,?如强制植?垃圾?告,视觉污染,?户眼容易瞎。冒充?险 ,?如冒充淘宝?站,?户钱容易没。 HTTPS 在 HTTP 与 TCP 层之间加?了 SSL/TLS 协议,可以很好的解决了上述的?险:信息加密 :交互信息?法被窃取,但你的号会因为「?身忘记」账号?没。校验机制 :?法篡改通信内容,篡改了就不能正常显示,但百度「竞价排名」依然可以搜索垃圾?告。身份证书 :证明淘宝是真的淘宝?,但你的钱还是会因为「剁?」?没。
可?,只要?身不做「恶」,SSL/TLS 协议是能保证通信是安全的。
HTTPS 是如何解决上?的三个?险的?
混合加密 的方式实现信息的机密性 ,解决了窃听的?险。摘要算法 的方式来实现完整性 ,它能够为数据?成独???的「指纹」,指纹?于校验数据的完整性,解决了篡改的?险。- 将服务器公钥放?到
数字证书 中,解决了冒充 的?险。
1. 混合加密
通过混合加密 的?式可以保证信息的机密性 ,解决了窃听的?险。 【tip】:这张图看不懂没关系,后面会有详细解释
HTTPS 采?的是对称加密 和?对称加密 结合的「混合加密」?式:
- 在通信建?前采?
?对称加密 的?式交换「会话秘钥」,后续就不再使??对称加密。 - 在通信过程中全部
使?对称加密 的「会话秘钥」的?式加密明?数据。
采?「混合加密」的?式的原因:
对称加密 只使??个密钥,运算速度快,密钥必须保密,?法做到安全的密钥交换。?对称加密 使?两个密钥:公钥和私钥,公钥可以任意分发?私钥保密,解决了密钥交换问题但速度慢
2. 摘要算法
摘要算法 ?来实现完整性 ,能够为数据?成独???的「指纹」,?于校验数据的完整性,解决了篡改的?险。 客户端在发送明?之前会通过摘要算法(Hash算法)算出明?的「指纹」,发送的时候把「指纹 + 明?」?同加密成密?后,发送给服务器,服务器解密后,?相同的摘要算法算出发送过来的明?,通过?较客户端携带的「指纹」和当前算出的「指纹」做?较,若「指纹」相同,说明数据是完整的。 【tip】:这里所说的“指纹”,即数字摘要
3. 数字证书
客户端先向服务器端索要公钥,然后?公钥加密信息,服务器收到密?后,???的私钥解密。
这就存在些问题,如何保证公钥不被篡改和信任度?
所以这?就需要借助第三?权威机构 CA (数字证书认证机构),将服务器公钥放在数字证书(由数字证书认证机构颁发)中 ,只要证书是可信的,公钥就是可信的。
通过数字证书的?式保证服务器公钥的身份,解决冒充的?险。
HTTPS 是如何建?连接的?其间交互了什么?
SSL/TLS 协议基本流程:
- 客户端向服务器索要并验证服务器的公钥。
- 双?协商?产「会话秘钥」。
- 双?采?「会话秘钥」进?加密通信。
前两步也就是 SSL/TLS 的建?过程,也就是握?阶段。 SSL/TLS 的「握?阶段」涉及四次通信,可?下图: 普通三次握手之后,
SSL/TLS 协议建?的详细流程:
1. Client Hello
?先,由客户端向服务器发起加密通信请求,也就是ClientHello 请求。 在这?步,客户端主要向服务器发送以下信息: (1)客户端?持的 SSL/TLS 协议版本,如 TLS 1.2 版本。 (2)客户端?产的随机数( Client Random ),后??于?产「会话秘钥」。 (3)客户端?持的密码套件列表,如 RSA 加密算法。 2. Server Hello
服务器收到客户端请求后,向客户端发出响应,也就是 SeverHello 。服务器回应的内容有如下内容: (1)确认 SSL/ TLS 协议版本,如果浏览器不?持,则关闭加密通信。 (2)服务器?产的随机数( Server Random ),后??于?产「会话秘钥」。 (3)确认的密码套件列表,如 RSA 加密算法。 (4)服务器的数字证书。 3. 客户端回应
客户端收到服务器的回应之后,?先通过浏览器或者操作系统中的 CA 公钥,确认服务器的数字证书的真实性。 如果证书没有问题,客户端会从数字证书中取出服务器的公钥,然后使?它加密报?,向服务器发送如下信息: (1)?个随机数( pre-master key )(预主密钥)。该随机数会被服务器公钥加密。 (2)加密通信算法改变通知,表示随后的信息都将?「会话秘钥」加密通信。 (3)客户端握?结束通知,表示客户端的握?阶段已经结束。这?项同时把之前所有内容的发?的数据做个摘要,?来供服务端校验。
此时,服务器和客户端就同时有三个随机数,接着就?双?协商的加密算法,通过前两个随机数以及第三个随机数,各??成本次通信的「会话秘钥」。
4. 服务器的最后回应
服务器收到客户端的第三个随机数( pre-master key )之后,通过协商的加密算法,计算出本次通信的「会话秘钥」。然后,向客户端发?最后的信息: (1)加密通信算法改变通知,表示随后的信息都将?「会话秘钥」加密通信。 (2)服务器握?结束通知,表示服务器的握?阶段已经结束。这?项同时把之前所有内容的发?的数据做个摘要,?来供客户端校验。
?此,整个 SSL/TLS 的握?阶段全部结束。接下来,客户端与服务器进?加密通信,就完全是使?普通的 HTTP协议,只不过?「会话秘钥」加密内容。
五、HTTP/1.1、HTTP/2、HTTP/3 演变
说说 HTTP/1.1 相? HTTP/1.0 提?了什么性能?
HTTP/1.1 相? HTTP/1.0 性能上的改进:
- 使? TCP ?连接的?式改善了 HTTP/1.0 短连接造成的性能开销。
- ?持管道(pipeline)?络传输,只要第?个请求发出去了,不必等其回来,就可以发第?个请求出去,可以减少整体的响应时间。
但 HTTP/1.1 还是有性能瓶颈:
- 请求 / 响应头部(Header)未经压缩就发送,?部信息越多延迟越?。只能压缩 Body 的部分;
- 发送冗?的?部。每次互相发送相同的?部造成的浪费较多;
- 服务器是按请求的顺序响应的,如果服务器响应慢,会招致客户端?直请求不到数据,也就是队头阻塞;
- 没有请求优先级控制;
- 请求只能从客户端开始,服务器只能被动响应。
那上?的 HTTP/1.1 的性能瓶颈,HTTP/2 做了什么优化?
HTTP/2 协议是基于 HTTPS 的,所以 HTTP/2 的安全性也是有保障的。 那 HTTP/2 相? HTTP/1.1 性能上的改进:
1. 头部压缩
HTTP/2 会压缩头 (Header)如果你同时发出多个请求,他们的头是?样的或是相似的,那么,协议会帮你消除重复的部分 。
这就是所谓的HPACK 算法:在客户端和服务器同时维护?张头信息表,所有字段都会存?这个表,?成?个索引号,以后就不发送同样字段了,只发送索引号,这样就提?速度 了。
2. ?进制格式
HTTP/2 不再像 HTTP/1.1 ?的纯?本形式的报?,?是全?采?了?进制格式 ,头信息和数据体都是?进制,并且统称为帧(frame):头信息帧和数据帧 。 这样虽然对?不友好,但是对计算机?常友好,因为计算机只懂?进制,那么收到报?后,?需再将明?的报?转成?进制,?是直接解析?进制报?,这增加了数据传输的效率 。
3. 数据流
HTTP/2 的数据包不是按顺序发送的,同?个连接??连续的数据包,可能属于不同的回应。因此,必须要对数据包做标记,指出它属于哪个回应。
每个请求或回应的所有数据包,称为?个数据流( Stream )。每个数据流都标记着?个独???的编号,其中规定客户端发出的数据流编号为奇数, 服务器发出的数据流编号为偶数
客户端还可以指定数据流的优先级 。优先级?的请求,服务器就先响应该请求。 4. 多路复用
HTTP/2 是可以在?个连接中并发多个请求或回应,?不?按照顺序??对应。
移除了 HTTP/1.1 中的串?请求,不需要排队等待,也就不会再出现「队头阻塞」问题,降低了延迟,?幅度提?了连接的利?率 。
举例来说,在?个 TCP 连接?,服务器收到了客户端 A 和 B 的两个请求,如果发现 A 处理过程?常耗时,于是就回应 A 请求已经处理好的部分,接着回应 B 请求,完成后,再回应 A 请求剩下的部分。 5. 服务器推送
HTTP/2 还在?定程度上改善了传统的「请求 - 应答」?作模式,服务不再是被动地响应,也可以主动 向客户端发送消息。
举例来说,在浏览器刚请求 HTML 的时候,就提前把可能会?到的 JS、CSS ?件等静态资源主动发给客户端,减少延时的等待 ,也就是服务器推送(Server Push,也叫 Cache Push)。
HTTP/2 有哪些缺陷?HTTP/3 做了哪些优化?
HTTP/2 主要的问题在于,多个 HTTP 请求在复??个 TCP 连接,下层的 TCP 协议是不知道有多少个 HTTP 请求的。所以?旦发?了丢包现象,就会触发 TCP 的重传机制 ,这样在?个 TCP 连接中的所有的 HTTP 请求都必须等待这个丢了的包被重传回来 。
- HTTP/1.1 中的管道( pipeline)传输中如果有?个请求阻塞了,那么队列后请求也统统被阻塞住了
- HTTP/2 多个请求复??个TCP连接,?旦发?丢包,就会阻塞住所有的 HTTP 请求。
这都是基于 TCP 传输层的问题,所以 HTTP/3 把 HTTP 下层的 TCP 协议改成了 UDP! UDP 发?是不管顺序,也不管丢包的,所以不会出现 HTTP/1.1 的队头阻塞 和 HTTP/2 的?个丢包全部重传问题。
?家都知道 UDP 是不可靠传输的,但基于 UDP 的 QUIC 协议 可以实现类似 TCP 的可靠性传输。
- QUIC 有??的?套机制可以保证传输的可靠性的。当某个流发?丢包时,只会阻塞这个流,
其他流不会受到影响 。 - TLS3 升级成了最新的
1.3 版本 ,头部压缩算法也升级成了 QPack 。 - HTTPS 要建??个连接,要花费 6 次交互,先是建?三次握?,然后是
TLS/1.3 的三次握?。QUIC 直接把以往的 TCP 和 TLS/1.3 的 6 次交互合并成了 3 次,减少了交互次数。 所以, QUIC 是?个在 UDP 之上的伪 TCP + TLS + HTTP/2 的多路复?的协议。
QUIC 是新协议,对于很多?络设备,根本不知道什么是 QUIC,只会当做 UDP,这样会出现新的问题。所以HTTP/3 现在普及的进度?常的缓慢,不知道未来 UDP 是否能够逆袭 TCP。
|