# *Node* 事件循环 ## 经典真题 - 请简述一下 *Node.js* 中的事件循环,和浏览器环境的事件循环有何不同? ## *Node.js* 与浏览器的事件循环有何区别? ### 进程与线程 我们经常说 *JavaScript* 是一门单线程语言,指的是一个进程里只有一个主线程,那到底什么是线程?什么是进程? 首先需要把这个问题搞明白。 进程是 *CPU* 资源分配的最小单位,而线程是 *CPU* 调度的最小单位。举个例子,看下面的图: image-20211015112136231 - 进程好比图中的工厂,有单独的专属自己的工厂资源。 - 线程好比图中的工人,多个工人在一个工厂中协作工作,工厂与工人是 *1:n* 的关系。也就是说**一个进程由一个或多个线程组成,线程是一个进程中代码的不同执行路线**。 - 工厂的空间是工人们共享的,这象征**一个进程的内存空间是共享的,每个线程都可用这些共享内存**。 - 多个工厂之间独立存在。 接下来我们回过头来看多进程和多线程的概念: - 多进程:在同一个时间里,同一个计算机系统中如果允许两个或两个以上的进程处于运行状态。多进程带来的好处是明显的,比如你可以听歌的同时,打开编辑器敲代码,编辑器和听歌软件的进程之间丝毫不会相互干扰。 - 多线程:程序中包含多个执行流,即在一个程序中可以同时运行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执行的线程来完成各自的任务。 以 *Chrome* 浏览器中为例,当你打开一个 *Tab* 页时,其实就是创建了一个进程。 image-20211015112546949 一个进程中可以有多个线程,比如渲染线程、*JS* 引擎线程、*HTTP* 请求线程等等。当你发起一个请求时,其实就是创建了一个线程,当请求结束后,该线程可能就会被销毁。 ### 浏览器内核 简单来说浏览器内核是通过取得页面内容、整理信息(应用 *CSS* )、计算和组合最终输出可视化的图像结果,通常也被称为渲染引擎。 浏览器内核是多线程,在内核控制下各线程相互配合以保持同步,一个浏览器通常由以下常驻线程组成: - *GUI* 渲染线程 - *JavaScript* 引擎线程 - 定时触发器线程 - 事件触发线程 - 异步 *http* 请求线程 #### *GUI* 渲染线程 - 主要负责页面的渲染,解析 *HTML*、*CSS*,构建 *DOM* 树,布局和绘制等。 - 当界面需要重绘或者由于某种操作引发回流时,将执行该线程。 - 该线程与 *JS* 引擎线程互斥,当执行 *JS* 引擎线程时,*GUI* 渲染会被挂起,当任务队列空闲时,主线程才会去执行 *GUI* 渲染。 #### *JavaScript* 引擎线程 - 该线程当然是主要负责处理 *JavaScript* 脚本,执行代码。 - 也是主要负责执行准备好待执行的事件,即定时器计数结束,或者异步请求成功并正确返回时,将依次进入任务队列,等待 *JS* 引擎线程的执行。 - 当然,该线程与 *GUI* 渲染线程互斥,当 *JS* 引擎线程执行 *JavaScript* 脚本时间过长,将导致页面渲染的阻塞。 #### 定时触发器线程 - 负责执行异步定时器一类的函数的线程,如:*setTimeout、setInterval*。 - 主线程依次执行代码时,遇到定时器,会将定时器交给该线程处理,当计数完毕后,事件触发线程会将计数完毕后的事件加入到任务队列的尾部,等待 *JS* 引擎线程执行。 #### 事件触发线程 - 主要负责将准备好的事件交给 *JS* 引擎线程执行。 比如 *setTimeout* 定时器计数结束, *ajax* 等异步请求成功并触发回调函数,或者用户触发点击事件时,该线程会将整装待发的事件依次加入到任务队列的队尾,等待 *JS* 引擎线程的执行。 #### 异步 *http* 请求线程 - 负责执行异步请求一类的函数的线程,如:*Promise、fetch、ajax* 等。 - 主线程依次执行代码时,遇到异步请求,会将函数交给该线程处理,当监听到状态码变更,如果有回调函数,事件触发线程会将回调函数加入到任务队列的尾部,等待 *JS* 引擎线程执行。 ### 浏览器中的事件循环 #### 宏任务和微任务 事件循环中的异步队列有两种:宏任务( *macro* )队列和微任务( *micro* )队列。 **宏任务队列有一个,微任务队列只有一个**。 - 常见的宏任务有:*setTimeout、setInterval、requestAnimationFrame、script*等。 - 常见的微任务有:*new Promise( ).then(回调)、MutationObserver* 等。 #### 事件循环流程 一个完整的事件循环过程,可以概括为以下阶段: image-20211015121213384 - 一开始执行栈空,我们可以把**执行栈认为是一个存储函数调用的栈结构,遵循先进后出的原则**。微任务队列空,宏任务队列里有且只有一个 *script* 脚本(整体代码)。 - 全局上下文( *script* 标签)被推入执行栈,同步代码执行。在执行的过程中,会判断是同步任务还是异步任务,通过对一些接口的调用,可以产生新的宏任务与微任务,它们会分别被推入各自的任务队列里。同步代码执行完了,*script* 脚本会被移出宏任务队列,这个过程本质上是队列的宏任务的执行和出队的过程。 - 上一步我们出队的是一个宏任务,这一步我们处理的是微任务。但需要注意的是:当一个宏任务执行完毕后,会执行所有的微任务,也就是将整个微任务队列清空。 - 执行渲染操作,更新界面 - 检查是否存在 *Web worker* 任务,如果有,则对其进行处理 - 上述过程循环往复,直到两个队列都清空 宏任务和微任务的执行流程,总结起来就是: **当某个宏任务执行完后,会查看是否有微任务队列。如果有,先执行微任务队列中的所有任务,如果没有,会读取宏任务队列中排在最前的任务,执行宏任务的过程中,遇到微任务,依次加入微任务队列。栈空后,再次读取微任务队列里的任务,依次类推。** 执行流程如下图所示: image-20211015114206131 这里我们可以来看两道具体的代码题目加深理解: ```js console.log('script start'); setTimeout(function() { console.log('setTimeout'); }, 0); Promise.resolve().then(function() { console.log('promise1'); }).then(function() { console.log('promise2'); }); console.log('script end'); ``` 上面的代码输出的结果为: ```js script start script end promise1 promise2 setTimeout ``` 原因很简单,首先会执行同步的任务,输出 *script start* 以及 *script end*。接下来是处理异步任务,异步任务分为宏任务队列和微任务队列,在执行宏任务队列中的每个宏任务之前先把微任务清空一遍,由于 *promise* 是微任务,所以会先被执行,而 *setTimeout* 由于是一个宏任务,会在微任务队列被清空后再执行。 ```js Promise.resolve().then(()=>{ console.log('Promise1') setTimeout(()=>{ console.log('setTimeout2') },0) }) setTimeout(()=>{ console.log('setTimeout1') Promise.resolve().then(()=>{ console.log('Promise2') }) },0) ``` 上面的代码输出的结果为: ```js Promise1 setTimeout1 Promise2 setTimeout2 ``` 一开始执行栈的同步任务(这属于宏任务)执行完毕,会去查看是否有微任务队列,上题中存在(有且只有一个),然后执行微任务队列中的所有任务输出 *Promise1*,同时会生成一个宏任务 *setTimeout2*。 然后去查看宏任务队列,宏任务 *setTimeout1* 在 *setTimeout2* 之前,先执行宏任务 *setTimeout1*,输出 *setTimeout1*。在执行宏任务 *setTimeout1* 时会生成微任务 *Promise2* ,放入微任务队列中,接着先去清空微任务队列中的所有任务,输出 *Promise2*。 清空完微任务队列中的所有任务后,就又会去宏任务队列取一个,这回执行的是 *setTimeout2*。 ### *Node.js* 中的事件循环 #### *Node.js* 事件循环介绍 *Node.js* 中的事件循环和浏览器中的是完全不相同的东西。 *Node.js* 采用 *V8* 作为 *JS* 的解析引擎,而 *I/O* 处理方面使用了自己设计的 *libuv*,*libuv* 是一个基于事件驱动的跨平台抽象层,封装了不同操作系统一些底层特性,对外提供统一的 *API*,事件循环机制也是它里面的实现。 image-20211015121258759 可以看出 *Node.JS* 的事件循环比浏览器端复杂很多。*Node.js* 的运行机制如下: - *V8* 引擎解析 *JavaScript* 脚本。 - 解析后的代码,调用 *Node API*。 - *libuv* 库负责 *Node API* 的执行。它将不同的任务分配给不同的线程,形成一个事件循环,以异步的方式将任务的执行结果返回给 *V8* 引擎。 - *V8* 引擎再将结果返回给用户。 整个架构图如下所示: image-20211029160543365 #### 事件循环的 *6* 个阶段 其中 *libuv* 引擎中的事件循环分为 *6* 个阶段,它们会按照顺序反复运行。每当进入某一个阶段的时候,都会从对应的回调队列中取出函数去执行。当队列为空或者执行的回调函数数量到达系统设定的阈值,就会进入下一阶段。 node 从上图中,大致看出 *Node.js* 中的事件循环的顺序: 外部输入数据 –-> 轮询阶段( *poll* )-–> 检查阶段( *check* )-–> 关闭事件回调阶段( *close callback* )–-> 定时器检测阶段( *timer* )–-> *I/O* 事件回调阶段( *I/O callbacks* )-–>闲置阶段( *idle、prepare* )–->轮询阶段(按照该顺序反复运行)... 以上 *6* 个阶段所做的事情如下: - *timers* 阶段:这个阶段执行 *timer*( *setTimeout、setInterval* )的回调 - *I/O callbacks* 阶段:处理一些上一轮循环中的少数未执行的 *I/O* 回调 - *idle、prepare* 阶段:仅 *Node.js* 内部使用 - *poll* 阶段:获取新的 *I/O* 事件, 适当的条件下 *Node.js* 将阻塞在这里 - *check* 阶段:执行 *setImmediate( )* 的回调 - *close callbacks* 阶段:执行 *socket* 的 *close* 事件回调 注意:**上面六个阶段都不包括 *process.nextTick( )*** 接下去我们详细介绍 *timers、poll、check* 这 *3* 个阶段,因为日常开发中的绝大部分异步任务都是在这 *3* 个阶段处理的。 ***timer* 阶段** *timers* 阶段会执行 *setTimeout* 和 *setInterval* 回调,并且是由 *poll* 阶段控制的。同样,**在 *Node.js* 中定时器指定的时间也不是准确时间,只能是尽快执行**。 ***poll* 阶段** *poll* 是一个至关重要的阶段,这一阶段中,系统会做两件事情: - 回到 *timer* 阶段执行回调 - 执行 *I/O* 回调 并且在进入该阶段时如果没有设定了 *timer* 的话,会发生以下两件事情: - 如果 *poll* 队列不为空,会遍历回调队列并同步执行,直到队列为空或者达到系统限制 - 如果 *poll* 队列为空时,会有两件事发生: - 如果有 *setImmediate* 回调需要执行,*poll* 阶段会停止并且进入到 *check* 阶段执行回调 - 如果没有 *setImmediate* 回调需要执行,会等待回调被加入到队列中并立即执行回调,这里同样会有个超时时间设置防止一直等待下去 当然设定了 *timer* 的话且 *poll* 队列为空,则会判断是否有 *timer* 超时,如果有的话会回到 *timer* 阶段执行回调。 假设 *poll* 被堵塞,那么即使 *timer* 已经到时间了也只能等着,这也是为什么上面说定时器指定的时间并不是准确的时间。例如: ```js const start = Date.now(); setTimeout(function f1() { console.log("setTimeout", Date.now() - start); }, 200); const fs = require('fs'); fs.readFile('./index.js', 'utf-8', function f2() { console.log('readFile'); const start = Date.now(); // 强行延时 500 毫秒 while (Date.now() - start < 500) { } }) ``` ***check* 阶段** *setImmediate( )* 的回调会被加入 *check* 队列中,从事件循环的阶段图可以知道,*check* 阶段的执行顺序在 *poll* 阶段之后。 我们先来看个例子: ```js console.log('start') setTimeout(() => { console.log('timer1') Promise.resolve().then(function() { console.log('promise1') }) }, 0) setTimeout(() => { console.log('timer2') Promise.resolve().then(function() { console.log('promise2') }) }, 0) Promise.resolve().then(function() { console.log('promise3') }) console.log('end') // 输出结果:start => end => promise3 => timer1 => promise1 => timer2 => promise2 ``` 一开始执行同步任务,依次打印出 *start end*,并将 *2* 个 *timer* 依次放入 *timer* 队列,之后会立即执行微任务队列,所以打印出 *promise3*。 然后进入 *timers* 阶段,执行 *timer1* 的回调函数,打印 *timer1*,发现有一个 *promise.then* 回调将其加入到微任务队列并且立即执行,之后同样的步骤执行 *timer2*,打印 *timer2* 以及 *promise2*。 #### 一些注意点 ***setTimeout* 和 *setImmediate* 区别** 二者非常相似,区别主要在于调用时机不同。 - *setImmediate* 设计在 *poll* 阶段完成时执行,即 *check* 阶段 - *setTimeout* 设计在 *poll* 阶段为空闲时,且设定时间到达后执行,但它在 *timer* 阶段执行 来看一个具体的示例: ```js setTimeout(function timeout () { console.log('timeout'); },0); setImmediate(function immediate () { console.log('immediate'); }); ``` 对于以上代码来说,*setTimeout* 可能执行在前,也可能执行在后。首先 *setTimeout(fn, 0) === setTimeout(fn, 1)*,这是由源码决定的,进入事件循环也是需要成本的,如果在准备时候花费了大于 *1ms* 的时间,那么在 *timer* 阶段就会直接执行 *setTimeout* 回调。如果准备时间花费小于 *1ms*,那么就是 *setImmediate* 回调先执行了。 但当二者在异步 *I/O callback* 内部调用时,总是先执行 *setImmediate*,再执行 *setTimeout*,例如: ```js const fs = require('fs') fs.readFile(__filename, () => { setTimeout(() => { console.log('timeout'); }, 0) setImmediate(() => { console.log('immediate') }) }) // immediate // timeout ``` 在上述代码中,*setImmediate* 永远先执行。因为两个代码写在 *I/O* 回调中,*I/O* 回调是在 *poll* 阶段执行,当回调执行完毕后队列为空,发现存在 *setImmediate* 回调,所以就直接跳转到 *check* 阶段去执行回调了。 ***process.nextTick*** 这个函数其实是独立于事件循环之外的,它有一个自己的队列。当每个阶段完成后,如果存在 *nextTick* 队列,就会清空队列中的所有回调函数,并且优先于其他 *microtask* 执行。 ```js setTimeout(() => { console.log('timer1') Promise.resolve().then(function() { console.log('promise1') }) }, 0) process.nextTick(() => { console.log('nextTick') process.nextTick(() => { console.log('nextTick') process.nextTick(() => { console.log('nextTick') process.nextTick(() => { console.log('nextTick') }) }) }) }) // nextTick => nextTick => nextTick => nextTick => timer1 => promise1 ``` ***Promise.then*** *Promise.then* 也是独立于事件循环之外的,有一个自己的队列,但是优先级要比 *process.nextTick* 要低,所以当微任务中同时存在 *process.nextTick* 和 *Promise.then* 时,会优先执行前者。 ```js setTimeout(()=>{ console.log('timer1') Promise.resolve().then(function() { console.log('promise1') }) process.nextTick(() => { console.log('nexttick'); }) }, 0) setTimeout(()=>{ console.log('timer2') Promise.resolve().then(function() { console.log('promise2') }) }, 0) // timer1、nexttick、promise1、timer2、promise2 ``` #### *Node.js* 与浏览器的事件队列的差异 浏览器环境下,就两个队列,一个宏任务队列,一个微任务队列。微任务的任务队列是每个宏任务执行完之后执行。 在 *Node.js* 中,每个任务队列的每个任务执行完毕之后,就会清空这个微任务队列。 ![eventloop](https://xiejie-typora.oss-cn-chengdu.aliyuncs.com/2021-10-15-060748.png) ## 真题解答 - 请简述一下 *Node.js* 中的事件循环,和浏览器环境的事件循环有何不同? > 参考答案: > > *Node.JS* 的事件循环分为 *6* 个阶段: > > - *timers* 阶段:这个阶段执行 *timer*( *setTimeout、setInterval* )的回调 > - *I/O callbacks* 阶段:处理一些上一轮循环中的少数未执行的 *I/O* 回调 > - *idle、prepare* 阶段:仅 *Node.js* 内部使用 > - *poll* 阶段:获取新的 *I/O* 事件, 适当的条件下 *Node.js* 将阻塞在这里 > - *check* 阶段:执行 *setImmediate( )* 的回调 > - *close callbacks* 阶段:执行 *socket* 的 *close* 事件回调 > > 事件循环的执行顺序为: > > 外部输入数据 –-> 轮询阶段( *poll* )-–> 检查阶段( *check* )-–> 关闭事件回调阶段( *close callback* )–-> 定时器检测阶段( *timer* )–-> *I/O* 事件回调阶段( *I/O callbacks* )-–>闲置阶段( *idle、prepare* )–->轮询阶段(按照该顺序反复运行)... > > 浏览器和 *Node.js* 环境下,微任务任务队列的执行时机不同 > > - 在 *Node.js* 中,每个任务队列的每个任务执行完毕之后,就会清空这个微任务队列。 > - 浏览器环境下,就两个队列,一个宏任务队列,一个微任务队列。微任务的任务队列是每个宏任务执行完之后执行。 -*EOF*-