lovelmh13/myBlog

完整版的 V8 垃圾回收机制

Opened this issue · 0 comments

浏览器的垃圾回收机制

在进行垃圾回收的时候,对于栈内存和堆内存,使用了不同的方式进行垃圾回收。栈内存的回收方式很简单,我们先看一下。

栈内存的垃圾回收

function foo(){
    var a = 1
    var b = {name:"极客邦"}
    function showName(){
      var c = 2
      var d = {name:"极客时间"}
    }
    showName()
}
foo()

image

当执行 showName 的时候,会有一个记录当前执行状态的指针(ESP)指向 showName 的执行上下文,然后当 showName 执行完成以后,ESP 向下滑动到 foo 上,原来的 showName 执行上下文就没有用了。如果 foo 里再有个函数要被执行,那个那个新的执行上下文就会出现在原本 showName 的执行上下文的地方。如下图:
img

foo 也执行完成以后,就只剩下全局执行上下文了。但是,在堆内存中的数据,依然还在:
img

所以,**栈内存中的垃圾回收,就是 JavaScript 引擎通过移动 ESP 指针来释放函数保存在栈中执行上下文。**效率很快。

堆内存的垃圾回收

函数中的执行上下文用完被释放掉了,但是堆内存中的值怎么才能被回收呢?这就比较复杂了,有不同的垃圾回收机制来针对不同的情况来进行堆内存中的垃圾回收。

有一个「代际假说」,垃圾回收是建立在在这假说上的。

代际假说认为:

  1. 大部分对象在内存中存在的时间都很短。很多对象一经分配内存,很快就变得不可访问了。
  2. 不死的对象,会获得更久。

V8 的垃圾回收机制就跟这个假说很像了。

在 V8 中,堆内存被分为了两个部分,一个是新生代内存空间,一个是老生代内存空间。其中新生代存放存活时间短的对象,老生代存放存活时间长或者常驻的对象。

image

新生代和老生代虽然回收的算法不一样,但是工作流程都是一样的:

  1. 标记活动和非活动的对象。
  2. 回收非活动的对象占的内存。
  3. 内存整理(整理内存碎片;内存碎片是因为出现了不连续的内存空间,如果有需要分配较大的连续的内存空间且当前的碎片化的空间又不够它放的情况时,就会提前触发垃圾回收,整理内存就是把不连续的内存空间变成连续的)

标记活动对象

新生代和老生代的标记活动对象都是一样的。

依然使用文章开头的代码,当执行完成 showName 以后,ESP 指向了 foo ,此时 1003 的地址没有被其他地方所引用了,在图中被标记为了红色。1050 的地址还在被 foo 引用着,会被标记成为活动对象。

堆内存在 V8 的源码中可以看见,默认的最大值在 64 位的系统上是 1464 MB(约 1.4 GB),在 32 位的系统上是 732 MB(约 0.7GB)。

新生代内存

新生代内存在堆内存占的比较小,从上图可以看出来。这是因为新生代内存经常使用,如果太大,每次清理时间就会变久。

新生代内存默认在 64 位的系统上是 32 MB,在 32 位的系统上是 16 MB。

Scavenge 算法

新生代内存采用 Scavenge 算法。Scavenge 又是采用 Cheney 算法实现的。这个听一耳朵就行。

Cheney 将新生代内存等分,一分为二。每次只使用一个,使用的叫做 From 空间,也可以叫对象区域。空闲的叫做 To 空间,也可以叫做空闲区域。

把内存一分为二,会比较浪费空间,但是新生代内存空间比较小,用空间换时间,还是很不错的选择,所以在新生代的常见下,使用 Scavenge 算法是很合适的。

当一个新对象进入堆内存时(对比上面的通用工作流程):

  1. 会先进入到新生代内存的 From 空间来。当进行垃圾回收的时候,首先 From 空间要检查存活的对象,然后把存活的对象扔到 To 空间里去。
  2. 把留在 From 空间的非存活的对象释放掉,然后把 To 空间和 From 空间再对换,这样 From 空间又存放着当前活动的对象,To 空间又变成了空闲的状态了。
  3. 没有第三步了。因为经过 From 和 To 的互相兑换,并不需要执行碎片整理的步骤。这也是通过 空间换时间 的做法

但是这时一定会有疑问了,新生代内存空间很小,如果当前存活的对象很多,那岂不是新生代的内存要溢出了?所以还会有另一个机制,来保证新生代内存不会被占满。

新生代内存向老生代内存的晋升

对象的晋升机制有两种:

  1. 当对象从 From 空间复制到 To 空间的时候,检查是否已经经过一次回收了,如果经历过,那这次回收的时候,这个对象就会被复制到老生代内存中。

image

  1. 当 To 空间已经被占用了 25% 的内存了,这个对象就会直接晋升到老生代的内存里去。

为什么有 25% 的限制呢?因为当 Scavenge 回收完成以后,To 就要变成 From 了。变成 From 以后,内存已经被使用了超过了 25%,可能会影响到新进来的对象的内存分配。

image

老生代内存

老生代内存默认在 64 位的系统上是 1400 MB,在 32 位的系统上是 700 MB。

老生代内存存放的都是生命周期较长的对象,并且老生代内存比较大,这个时候再用 Scavenge 算法会有两个问题:

  1. 存活的对象多,复制存活对象时效率低。(所以在老生代里,我们不处理存活对象,而是对非存活对象下手了)
  2. 浪费一半的空间。

如此一来,就是用了 Mark-Sweep 和 Mark-Compact 算法结合的方式来处理了。

Mark-Sweep 标记-清除

Mark-Sweep 算法的做法是对一组元素从根开始递归便利能达到的元素就是活动对象,没有达到的就是失活的垃圾数据。会对活动的对象进行标记,然后清除掉没有标记的对象。

但是这么做会有个问题,就是会产生不连续的内存空间。当大内存的对象进来可能会放不下,就会提前触发垃圾回收,这次的回收是没有必要的。所以又出现了一种Mark-Compact 算法,使内存不会有不连续的空间。

img

Mark-Compact 标记-整理

Mark-Compact 基于 Mark-Sweep 演变过来。同样都是要标记活的对象,区别在于在整理时,会把活的对象网一端移动,移动完成后,直接清理表边界外的内存。

下图:白色是存活对象,黑色是死亡的对象,浅色是碎片内存空间。

image

对比新生代内存的回收,与新生代一样的是都标记活着的对象。与新生代不同的是,新生代移动的是活着的对象,而老生代移动的是死亡的对象。

在 V8 中,这两种回收策略是结合使用的。

看一下不同策略的对比:

image

看到有人说:现代的浏览器用闭包不会造成内存泄漏,因为垃圾回收是用的标记清除。但是如果没有用的闭包还保存在全局变量中,依然会造成内存泄漏。

全暂停

不管使用 3 种哪种垃圾回收机制,在回收的时候都会暂停一下逻辑的执行,JavaScript 是运行在主线程上的。在 V8 分代式的回收机制中,一次小的垃圾回收只收集新生代的,这个还好,毕竟新生代的内存小,影响不会太大。但是老生代的就不行了,内存大,活动对象多,标记费时间。

所以 V8 采取了增量标记的方法。从标记阶段入手,拆成一小段,一小段的来标记,与 JavaScript 的执行交替执行,直到标记阶段完成。经过增量标记以后,垃圾回收的最大停顿时间可以减小到原来的 1/6。

img

image

同时,清理和整理阶段也都变成增量式的,进一步降低时间。

参考:

《深入浅出 Node.js》

极客时间《浏览器工作原理与实践》13 | 垃圾回收:垃圾数据是如何自动回收的?