浏览器输入URL发生了什么
浏览器输入URL发生了什么
从输入 URL
到页面呈现发生了什么?
整体过程:
在用户输入 URL,按下回车之后,走过的步骤:
DNS
解析TCP
连接- 发送
HTTP
请求 - 服务器响应
- 浏览器解析渲染页面
DNS 解析
DNS
解析过程就是通过网络查找哪台机器有你需要的资源的过程。
浏览器输入 github.com
并不是真正意义上的去查找这个,而是查找这个域名解析到的 IP
地址。
互联网上每一台计算机的唯一标识是它的 IP
地址,但是 IP
地址并不方便记忆,所以互联网设计者为了方便,才会搞出 github.com
这样的域名。
- DNS 解析过程:
- 查询
www.github.com
- 访问客户端 DNS 缓存:浏览器缓存 → 系统缓存(host) → 路由器缓存
- 访问 ISP DNS 服务器(ISP,互联网服务提供商),如果本地服务器有,则直接返回;如果没有,让本地 DNS 服务器去咨询查找。
- 本地去咨询 DNS 根服务器,DNS 根服务器发现是
.com 区域
管理的,告诉本地去咨询它。 - 本地去咨询 .com 顶级域名服务器,.com 顶级域名服务器不太清楚,告诉本地去咨询
github.com
主区域 的服务器。 - 本地去咨询 github.com 主域名服务器,baidu.com 域服务器查找到对应的 IP 地址,返回给本地。
- 本地服务器通知用户,
github.com
对应的 IP 地址,同时缓存这个 IP 地址,下次就直接访问了。
TCP 连接
TCP 连接的内容,详细请看 《TCP 三次握手和四次挥手》
- 建立连接阶段:3 次握手。建立客户端和服务器之间的连接。
- 传输数据阶段
- 断开连接阶段:4 次挥手。断开客户端和服务器之间的连接。
发送 HTTP 请求
发送 HTTP
请求的过程就是构建 HTTP
请求报文,并通过 TCP
协议发送到服务器指定端口(HTTP
协议默认端口 80/8080
,HTTPS
协议默认端口 443
)。
HTTP
请求报文由 3 部分组成:请求行、请求报文 和 请求正文。
- 请求行:常用方法有:GET、POST、PUT、DELETE、OPTIONS、HEAD。
- 请求报头:允许客户端向服务器传递请求的附加信息和客户端自身的信息。
- 请求正文:通过 POST、PUT 等方法时,通常需要客户端向服务器传递数据,这些数据就储存在请求正文中。
当然,HTTP
请求需要注意是否跨域,如何解决跨域问题:
JSONP
跨域资源共享(CORS)服务端设置
Access-Control-Allow-Origin
Nginx 反向代理跨域
跨域原理: 同源策略是浏览器的安全策略,不是HTTP协议的一部分。服务器端调用HTTP接口只是使用HTTP协议,不会执行JS脚本,不需要同源策略,也就不存在跨越问题。
服务器响应
服务器处理请求完毕后,会返回 HTTP
报文。
HTTP
响应报文也是由 3 部分组成:状态码、响应报头 和 响应报文。
状态码:1xx
指示信息-表示请求已接收;2xx
请求成功-表示请求成功接收并解析;3xx
重定向-表示要完成请求需要更进一步操作;4xx
客户端错误-请求有语法错误或者请求无法实现;5xx
:服务端错误-服务端未能实现合法的请求。
常见状态码:200(成功)、304(请求内容有缓存,不需要更新)、404(网页或者文件找不到)、500(服务器-后端处理错误)。
响应报头:常见的响应报头字段 Server
、Connection
等。
响应报文:服务器返回给浏览器的文本信息,通常 HTML、CSS、JS、图片等文件就放在这一部分。
浏览器解析渲染页面
浏览器的渲染过程为:
- 解析 HTML,生成
DOM
树 - 解析 CSS,生成
CSS 规则树(CSS Rule Tree)
- 将
DOM Tree
和CSS Rule Tree
相结合,生成 渲染树(Render Tree
) - 从根节点开始,计算每一个元素的大小、位置,给出每个节点所应该出现的屏幕精确坐标,从而得到基于渲染树的 布局渲染树(
Layout of the render tree
)。 - 遍历渲染树,将每个节点用 UI 渲染引擎来绘制,从而将整棵树绘制到页面上,这个步骤叫 绘制渲染树(
Painting the render tree
)
在解析渲染过程中,可能会产生 回流 和 重绘:
- 重绘 (repaint):当元素样式的改变不影响布局时,浏览器将使用重绘对元素进行更新,此时由于只需要 UI 层面的重新像素绘制,因此损耗较少。
- 回流 (reflow):又叫重排(
layout
)。当元素的尺寸、结构或者触发某些属性时,浏览器会重新渲染页面,称为回流。此时,浏览器需要重新经过计算,计算后还需要重新页面布局,因此是较重的操作。
渲染阻塞
JavaScript 的加载、解析和执行会阻塞 DOM 的构建。
在渲染的过程中,遇到一个 script 标记时,就会停止渲染,去请求脚本文件并执行脚本文件,因为浏览器渲染和 JavaScript 执行共用一个线程,而且这里必须是单线程操作,多线程会产生渲染 DOM 冲突。
JavaScript 的加载、解析与执行会严重阻塞DOM的构建。只有等到脚本文件执行完毕,才会去继续构建DOM。
JavaScript 不单会阻塞DOM构建,还会导致 CSSOM 也阻塞 DOM 的构建,如果 JavaScript 脚本还操作了CSSOM,而正好这个 CSSOM 还没有下载和构建,浏览器甚至会延迟脚本执行和构建 DOM,直至完成其 CSSOM的下载和构建,然后再执行 JavaScript,最后在继续构建 DOM。
因此 script 的位置很重要,在实际使用过程中遵循以下两个原则:
CSS 优先:引入顺序上,CSS 资源先于 JavaScript 资源。
JavaScript 置后:我们通常把JS代码放到页面底部,且 JavaScript 应尽量少影响 DOM 的构建。
也就是说:首屏渲染越快,就越不应该在首屏的时候加载 JS 文件,这也就是建议将 script
标签放到 body
标签底部,或者给 script
标签添加 defer/async
属性的原因。
为什么操作 DOM 慢
- 涉及 JS 引擎和渲染引擎两个线程间的通信,损耗性能。
- 操作 DOM 可能会重复回流,加剧性能损耗。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!