浏览器拿到一个网址,先判断该网址是否允许缓存,若是则查看本地缓存:1.有缓存且缓存处于有效期那直接拿来用;2.缓存不存在或者不可用,那开始下一步的请求。
浏览器判断请求:1.若是ip+port格式,则直接访问对应的服务器;2. 若是域名的格式,则开展一系列的dns递归查询:查询本地dns缓存>>本地dns服务器>>根dns服务器>>顶级dns服务器>>权威dns服务器>>GSLB,查到ip地址后返回最优ip组实现负载均衡,浏览器随机或者轮询一个ip开始http的请求之旅。
浏览器判断该网页是否允许缓存,然后添加Cache-Control的各种字段:
no-store是否允许缓存 // no-cache缓存必须进行验证 // noly-if-cached只接受代理的缓存等 // max-age最大生存时间 // max-stale 短时间过期可用 // min-fresh 最短有效时间等 // If-Modified-Since / if-None-Match / Last-modified / ETag等字段用于判断服务端是否有更新。
然后将请求发给代理服务器。请求代理服务器,如果是第一次,要经历浏览器和代理服务器的3次tcp握手进行连接,连接成功,发送http请求。
代理服务器拿到请求,首先查看是否允许缓存,允许那就查看自己本地缓存有没有,通过查看max-age/max-stale/min-fresh等信息判断是否过期以及是否能用,没有过期且能用则直接拿来用,将数据返回给客户端。没有过期但是不确定是否能用则向服务器发送请求,该缓存的数据有没有更新,还能否继续使用。
如果过期了,代理服务器将用客户端的请求,再次向真实服务器进行请求。如果也是第一次连接,需要经历代理服务器和真实服务器的3次tcp握手,连接成功,发送请求。
真实服务器收到请求之后,通过if-Modified-Since/Last-Modified/if-None-Match/ETag等字段判断是否有更新,没有更新,直接返回304(表示资源未修改,用于缓存控制。可以理解成“重定向已到缓存的文件”,即“缓存重定向”)。如果有更新,则将数据打包http response 返回。返回头字段会添加Cache-Control字段,用来判断缓存的控制策略以及生存周期,
"no-store不允许缓存/no-cache使用缓存必须先验证/must-revalidate缓存不过期可用过期必须重新请求验证/proxy-revalidate缓存过期只要求代理进行请求验证 /private不能在代理层保存只能在客户端保存/public缓存完全开放 /s-maxage缓存在代理上可以缓存的时间 / no-transform不允许代理对缓存做任何的改动"。
然后根据业务需求判断该地址是不是需要重定向,如果需要是短期的重定向还是永久的重定向,按需将状态码修改为301或者302。最后真实服务器将数据打包成http相应返回给代理服务器。
代理服务器收到真实服务器的回应数据,首先会查看Cache-Control里的字段,是否允许它进行缓存:如果是private,代理服务器不进行缓存,直接返回给客户端。public则根据s-maxage/no-transform进行缓存,如果可以优化并且代理服务器需要优化,那可能会先优化数据,否则同时将数据回发给客户端。
客户端收到数据,如果是304,则直接拿缓存数据进行渲染,并修改相关缓存变量,比如时间,以及缓存使用策略。如果收到了301或者302,那么客户端会再次发起新的url请求,进行跳转到最终的页面。
最后,底层tcp 经过4次挥手,完成关闭连接。
|