从浏览器输入 URl 到显示出页面的过程(详细版)

本文来源于：https://segmentfault.com/a/1190000013522717
本文只添加心得和个人解释

整体过程

过程大体可以分为以下的几步：

根据地址栏输入的地址向DNS（Domain Name System）查询 IP
通过 IP 向服务器发起 TCP 连接
向服务器发起请求
服务器返回请求内容
浏览器开始解析渲染页面并显示
关闭连接

一：DNS 解析

DNS 解析是什么就不多说了，这里说一下解析的步骤

先是缓存能找到的情况下：

浏览器的缓存：首先会像浏览器的缓存读取上一次的记录，，在 chrome 可以通过地址栏中输入chrome://net-internals/#dns查看缓存的当前状态
操作系统缓存：查找存储在系统运行内存中的缓存

如果缓存都找不到的话：

在 host 文件下查找
路由器缓存
ISP DNS 缓存
顶级 DNS 服务器/根 DNS 服务器

二：TCP 连接

拿到了要请求的资源服务器 IP 后，浏览器通过操作 OS 的 socket 与服务器进行 TCP 连接（一般来说操作系统已经封装好了 TCP/IP 等协议，提供套接字给应用去使用，该部分涉及到标准网络模型的知识，另外再开篇拓展。）

这个连接就是熟悉的 TCP 的三次握手

本机主动打开连接

第一次，本机将标识位 SYN 置为 1, seq = x(Sequence number)发送给服务端。此时本机状态为SYN-SENT
第二次，服务器收到包之后，将状态切换为SYN-RECEIVED，并将标识位 SYN 和 ACK 都置为 1, seq = y, ack = x + 1, 并发送给客户端。
第三次，客户端收到包后，将状态切换为ESTABLISHED，并将标识位 ACK 置为 1，seq = x + 1, ack = y + 1, 并发送给服务端。服务端收到包之后，也将状态切换为ESTABLISHED。

需要注意的一点是，有一些文章对 ACK 标识位和 ack（Acknowledgement Number）的解释比较模糊，有一些画图的时候干脆就写在一起了。虽然这两者有关联，但不是同一个东西，搞清楚这个误区可以更方便去理解。还有一些会把第二次握手描述成两个包（比如某百科……），实际上这也是不正确的

标识位 ACK 置为 1 表示我已确认收到 seq 为 x 的包，并回复确认序号 ack = x + 1
而 SYN 表示这是我第一次随机生成 seq 的序列 x，此后我每次发送的包都会在上一次发送的基础上增加 y（有数据的时候，y 是数据的长度，没有的时候 y = 1）。所以，当 seq 已初始化完成之后，没必要再把 SYN 置为 1

理解了这两点，也就不难理解为什么三次握手分别是 SYN、ACK/SYN、ACK 了。

标识位（TCP FLAG）

TCP 的头部固定有 20 个字节，其中分配了 6bits 给 TCP FLAG，组合起来用来表示当前包的类型。分别是 URGACKPSHRSTSYNFIN（CWRECE 放在保留位，暂不考虑）

URG：紧急指针，用于将要发送的包标识为“紧急”，这意味着不必等待前段数据被响应处理完即可发送给接收端。
ACK：确认标识，用于表示对数据包的成功接收。
PSH：推送标识，表示这个数据包应该被立即发送，不需要等待额外的数据。
RST：reset 标识，用来异常关闭连接。
SYN：同步标识，表示 TCP 连接已初始化。
FIN：完成标识，用于拆除上一个 SYN 标识。一个完整的 TCP 连接过程一定会有 SYN 和 FIN 包。

至此我们了解了一个 TCP 连接的过程，通道通了，是时候利用这个通道送东西了。我们从传输层再回到应用层

三-四：HTTP 的请求与相应

主体

在应用层，浏览器会分析这个 url，并设置好请求报文发出。请求报文中包括请求行、请求头、空行、请求主体。https 默认请求端口 443， http 默认 80。

请求行：请求行中包括请求的方法，路径和协议版本。
请求头：请求头中包含了请求的一些附加的信息，一般是以键值的形式成对存在，比如设置请求文件的类型 accept-type，以及服务器对缓存的设置。
空行：协议中规定请求头和请求主体间必须用一个空行隔开
请求主体：对于 post 请求，所需要的参数都不会放在 url 中，这时候就需要一个载体了，这个载体就是请求主题。

服务端收到请求之后，会根据 url 匹配到的路径做相应的处理，最后返回浏览器需要的页面资源。浏览器会收到一个响应报文，而所需要的资源就就在报文主体上。与请求报文相同，响应报文也有与之对应的起始行、首部、空行、报文主体，不同的地方在于包含的东西不一样。

响应行：响应报文的起始行同样包含了协议版本，与请求的起始行不同的是其包含的还有状态码和状态码的原因短语。
响应头：对应请求报文中的请求头，格式一致，但是各自有不同的首部。也有一起用的通用首部。
空行
报文主体：请求所需要的资源。

http 缓存

请求是浏览器的一个优化点，我们可以通过缓存来减少不必要的请求，进而加快页面的呈现。通过简单地设置 http 头部可以使用缓存的功能。一般来说有三种设置的方式

Last-Modify(响应头) + If-Modified-Since（请求头）

服务器在返回资源的时候设置 Last-Modify 当前资源最后一次修改的时间，浏览器会把这个时间保存下来，在下次请求的时候，请求头部 If-Modified-Since 会包含这个时间，服务端收到请求后，会比对资源最后更新的时间是否在 If-Modified-Since 设置的时间之后，如果不是，返回 304 状态码，浏览器将从缓存中获取资源。反之返回 200 和资源内容。

ETag（响应头） + If-None-Match（请求头）

根据资源标识符来确定文件是否存在修改，服务器每一次返回资源，都会在 Etag 中存放资源的标识符，浏览器收到这个标识符，在下一次请求的时候将标识符放在 If-None-Match 中，服务端将判断是否匹配，如果不匹配，返回 200 以及新的资源，反之返回 304，浏览器从缓存中获取资源

Cache-Control/Expires(响应头)

首先这不是一种方法，而是协议更替中的一种演化。在 http 1.0 的时代，我们基于 Pragma 和 Expires 控制缓存的生命周期。我们可以通过设置 Pragma 为 no-cache 关闭缓存功能，同样也可以在 Expires 中设置一个缓存失效的时间。需要注意的是，这个失效的时间是相对于服务器的实践而言的，如果人为地改变了客户端的时间，是会导致缓存失效的。

所以，为了解决这个问题，HTTP1.1 的协议加入了 Cache-Control，通过设置 Cache-Control 的 max-age 可以控制缓存的周期。在这个周期内，资源是新鲜的，浏览器再一次需要使用资源的时候，就不会发出请求了。

五：页面的展示

从服务器返回 html 文件了，为了呈现出正常的文档而开始解析。这里以 webkit 内核为案例：

通过 HTML 解析器解析 HTML 文档，构建一个 DOM Tree，同时通过 CSS 解析器解析 HTML 中存在的 CSS，构建 Style Rules，两者结合形成一个 Attachment。
通过 Attachment 构造出一个呈现树（Render Tree）
Render Tree 构建完毕，进入到布局阶段（layout/reflow），将会为每个阶段分配一个应出现在屏幕上的确切坐标。
最后将全部的节点遍历绘制出来后，一个页面就展现出来了。

从构建 DOM 树到呈现的过程如下

需要注意的是，这是一个渐进的过程，呈现引擎为了力求显示的及时，会在文档请求不完全的情况下就开始渲染页面，同时，如果在解析的过程中遇到 script 的时候，文档的解析将会停止下来，立即解析执行脚本，如果脚本是外部的，则会等待请求完成并解析执行。所以，为了不阻塞页面地呈现，一般会把 script 脚本放在文档的最后。

在最新的 HTML4 和 HTML5 规范中，也可以将脚本标注为defer，这样就不会停止文档解析，而是等到解析结束后才执行。HTML5 增加了一个选项，可将脚本标记为async，以便由其他线程解析和执行，也就是异步执行。

六：连接关闭

现在的页面为了优化请求的耗时，默认都会开启持久连接（keep-alive），那么一个 TCP 连接确切关闭的时机，是这个 tab 标签页关闭的时候。这个关闭的过程就是著名的四次挥手。关闭是一个全双工的过程，发包的顺序的不一定的。一般来说是客户端主动发起的关闭，过程如下。

假如最后一次客户端发出的数据 seq = x, ack = y;

客户端发送一个 FIN 置为 1 的包，ack = y， seq = x + 1，此时客户端的状态为 FIN_WAIT_1
服务端收到包后，状态切换为CLOSE_WAIT发送一个 ACK 为 1 的包， ack = x + 2。客户端收到包之后状态切换为FNI_WAIT_2
服务端处理完任务后，向客户端发送一个 FIN 包，seq = y; 同时将自己的状态置为LAST_ACK
客户端收到包后状态切换为TIME_WAIT，并向服务端发送 ACK 包，ack = y + 1，等待 2MSL 后关闭连接。

为什么客户端等待 2MSL

MSL: 全程 Maximum Segment Lifetime，中文可以翻译为报文最大生存时间。等待是为了保证连接的可靠性，确保服务端收到 ACK 包，如果服务端没有收到这个 ACK 包，将会重发 FIN 包给客户端，而这个时间刚好是服务端等待超时重发的时间 + FIN 的传输时间。

整体过程​

一：DNS 解析​

二：TCP 连接​

标识位（TCP FLAG）​

三-四：HTTP 的请求与相应​

主体​

http 缓存​

Last-Modify(响应头) + If-Modified-Since（请求头）​

ETag（响应头） + If-None-Match（请求头）​

Cache-Control/Expires(响应头)​

五：页面的展示​

六：连接关闭​

为什么客户端等待 2MSL​