一、JVM简略图
JVM内部的详细结构图
1、程序计数器
一块较小的内存空间, 是当前线程所执行的字节码的行号指示器,每条线程都要有一个独立的程序计数器,这类内存也称为“线程私有”的内存
2、Java虚拟机栈
描述了java方法执行时的内存模型,每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于 存储局部变量表、操作数栈、动态链接、方法出口等信息 。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。,栈帧随着方法调用而创建,随着方法结束而销毁
3、本地方法栈
本地方法栈和 Java虚拟机栈作用类似, 区别是Java虚拟机栈是为执行 Java 方法服务, 而本地方法栈则是为Native 方法服务
4、堆
堆是被所有线程共享的一块内存区域,各个线程所创建的对象和数组都保存在 Java 堆内存中,它也是垃圾收集器进行垃圾收集的最重要的内存区域。由于现代 VM 采用分代收集算法, 因此 Java 堆从 GC 的角度还可以细分为: 新生代(Eden 区、From Survivor 区和 To Survivor 区)和老年代。
5、方法区
二、GC的三个流程
1、什么时候进行垃圾回收?
2、如何判断哪些对象可以被回收?
- 引用计数法:引用通常是和对象是相关联的,通过引用而操作对象。因此,一个简单的办法是通过引用计数 来判断一个对象是否可以回收。一个对象如果没有任何与之关联的引用,即他们的引用计数都为 0,则说明该对象不太可能再被用到,那么这个对象就是可回收对象。
- 根搜索算法:以一系列"GC root"对象作为搜索的起点,如果某个对象和所有"GC root"对象之间都不存在一条可达路径,则称该对象是不可达的。不可达对象不等价于可回收对象,不可达对象变为可回收对象还要经过两次标记和筛选过程。第一次:判断对象是否有finalize方法或者执行过finalize,如果没有finalize方法或者已经执行过finalize方法,不需要进行第二次标记和筛选就可以回收,否则需要进行第二次标记和筛选。第二次:执行对象的finalize方法,执行完成或者执行过程中判断对象是否和GC Root是否有直接或者间接联系,如果依然没有联系则把对象放入回收列表等待回收,否则对象复活。哪些对象可以作为GC root对象:
(1)虚拟机栈(栈帧中的本地变量表)中引用的对象。 (2)方法区中的类静态属性引用的对象 (3)方法区中的常量引用的对象 (4)本地方法栈中JNI引用的对象
3、如何进行回收?
3.1.分代收集
当前主流 VM 在进行垃圾收集时都会采用”分代收集”(Generational Collection)算法, 这种算法会根据对象存活周期的不同将内存划分为几块, 如 JVM 中的 新生代、老年代、永久代,这样就可以根据各年代特点分别采用最适当的 GC 算法
- 新生代GC(Minor GC):采用复制算法进行垃圾回收。首先,把 Eden 和 Survivor From 区域中存活的对象复制到 Survivor To 区域(如果 To Space 无法足够存储某个对象,则将这个对象存储到老生代),并把这些对象的年龄+1(如果某些对象的年龄已经达到了老年的标准15,则复制到老年代区),然后,清空 Eden 和 Servivor From 中的对象,最后,Servivor To 和 Servivor From 互换。
1、复制算法:按内存容量将内存划分为等大小的两块。每次只使用其中一块,当这一块内存满后将尚存活的对象复制到另一块上去,把已使用的内存清掉。目前大部分 JVM 的 GC 对于新生代都采取 Copying 算法,因为新生代中每次垃圾回收都要回收大部分对象,即要复制的操作比较少,但通常并不是按照 1:1 来划分新生代。一般将新生代划分为一块较大的 Eden 空间和两个较小的 Survivor 空间(From Space, To Space),每次使用Eden 空间和其中的一块 Survivor 空间,当进行回收时,将该两块空间中还存活的对象复制到另一块 Survivor 空间中。 - 老年代GC(Major GC):
1、 标记清除算法(Mark-Sweep):分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清 除阶段回收被标记的对象所占用的空间。
2、标记整理算法(Mark-Compact):标记阶段和 Mark-Sweep 算法相同,标记后并不是着急清理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。
3.2.分区收集
分区算法则将整个堆空间划分为连续的不同小区间, 每个小区间独立使用, 独立回收. 这样做的好处是可以控制一次回收多少个小区间 , 根据最大允许停顿时间, 每次合理地回收若干个小区间(而不是整个堆), 从而减少一次 GC 所产生的停顿。
三、 Java中的四种引用
1、强引用
在 Java 中最常见的就是强引用,把一个对象赋给一个引用变量,这个引用变量就是一个强引用。当一个对象被强引用变量引用时,它处于可达状态,它是不可能被垃圾回收机制回收的,即使该对象以后永远都不会被用到 JVM 也不会回收。因此强引用是造成 Java 内存泄漏(OOM)的主要原因之一。
2、软引用
软引用需要用 SoftReference 类来实现,对于只有软引用的对象来说,当系统内存足够时它不会被回收,当系统内存空间不足时它会被回收。
3、弱引用
弱引用需要用 WeakReference 类来实现,它比软引用的生存期更短,对于只有弱引用的对象来说,只要垃圾回收机制一运行,不管 JVM 的内存空间是否足够,总会回收该对象占用的内存。
4、虚引用
虚引用需要 PhantomReference 类来实现,它不能单独使用,必须和引用队列联合使用。虚引用的主要作用是跟踪对象被垃圾回收的状态。
四、垃圾收集器
1、Serial 垃圾收集器(单线程、复制算法)
Serial(英文连续)是最基本垃圾收集器,使用复制算法,曾经是JDK1.3.1 之前新生代唯一的垃圾收集器。Serial 是一个单线程的收集器,它不但只会使用一条线程去完成垃圾收集工作,并且在进行垃圾收集的同时,还会暂停其他所有的工作线程(STW),直到垃圾收集结束。Serial 垃圾收集器虽然在收集垃圾过程中需要暂停所有其他的工作线程,但是它简单高效,对于限定单个 CPU 环境来说,可以获得最高的单线程垃圾收集效率,因此 Serial垃圾收集器依然是 java 虚拟机运行在 Client 模式下默认的新生代垃圾收集器 。
2、ParNew 垃圾收集器(Serial+多线程)
ParNew 垃圾收集器其实是 Serial 收集器的多线程版本,也使用复制算法,除了使用多线程进行垃圾收集之外,其余的行为和 Serial 收集器完全一样,ParNew 垃圾收集器在垃圾收集过程中同样也要暂停所有其他的工作线程(STW)。ParNew 收集器默认开启和 CPU 数目相同的线程数,ParNew垃圾收集器是很多 java虚拟机运行在 Server 模式下新生代的默认垃圾收集器。
3、Parallel Scavenge垃圾收集器(多线程复制算法、高效)
Parallel Scavenge 收集器也是一个新生代垃圾收集器,同样使用复制算法,也是一个多线程的垃圾收集器,它重点关注的是程序达到一个可控制的吞吐量,高吞吐量可以最高效率地利用 CPU 时间,尽快地完成程序的运算任务,主要适用于在后台运算而 不需要太多交互的任务。
4、Serial Old 垃圾收集器(单线程、标记整理算法 )
Serial Old 是 Serial 垃圾收集器年老代版本,它同样是个单线程的收集器,使用标记-整理算法,这个收集器也主要是java 虚拟机运行在 Client 模式下默认的年老代垃圾收集器。
5、Parallel Old 垃圾收集器(多线程、标记整理算法)
Parallel Old 收集器是Parallel Scavenge的老年代版本,使用多线程的标记-整理算法,在 JDK1.6才开始提供。在 JDK1.6 之前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只能保证新生代的吞吐量优先,无法保证整体的吞吐量,Parallel Old 正是为了在老年代同样提供吞吐量优先的垃圾收集器,如果系统对吞吐量要求比较高,可以优先考虑新生代 Parallel Scavenge和年老代 Parallel Old 收集器的搭配策略。
6、CMS 收集器(Concurrent Mark Sweep、多线程、标记清除算法**)
Concurrent mark sweep(CMS)收集器是一种老年代垃圾收集器,其最主要目标是获取最短的垃圾回收停顿时间,和其他老年代使用标记-整理算法不同,它使用多线程的标记-清除算法。CMS 工作机制相比其他的垃圾收集器来说更复杂,整个过程分为以下 4 个阶段:
- 初始标记:标记一下 GC Roots 能直接关联的对象,速度很快,仍然需要暂停所有的工作线程
- 并发标记:由GC Roots直接关联的对象开始遍历整个对象图,标记所有可达对象,这个过程耗时较长但是不需要停顿用户线程,用户线程可以与垃圾收集线程一起并发运行
- 重新标记:为了修正在并发标记期间,因用户程序运行而导致标记产生变动的那一部分对象的标记记录,仍然需要暂停所有的工作线程。该阶段的停顿时间通常会比初始标记阶段稍长一些,但远比并发标记阶段的时间段
- 并发清除 :清理删除掉标记阶段判断的已经死亡的对象,由于不需要移动存活对象,所以这个阶段也是可以同时与用户线程同时并发的。由于耗时最长的并发标记和并发清除过程中,垃圾收集线程可以和用户现在一起并发工作,所以总体上来看CMS 收集器的内存回收和用户线程是一起并发地执行
7、G1垃圾收集器(**)
- 发展历程:在G1垃圾回收器出现之前的所有其它收集器,包括CMS在内,垃圾收集的目标要么是整个新生代(Minor GC),要么就是整个老年代(Major GC),在要么就是整个Java堆(Full GC),而G1跳出了这个樊笼,它的回收集可以由堆内存中的任何部分组成,衡量标准不再是它属于哪个分代,而是哪块内存中存放的垃圾数量最多,回收收益最大,这就是G1收集器的Mixed GC模式
- G1特点:1、 G1仍是遵循分代理论设计的,但其堆内存的布局与其它收集器有明显的差异。2、 G1不在坚持固定大小以及固定数量的分代区域划分,而是把连续的Java堆划分为多个大小相等的独立区域,每一个区域都可以根据需要,扮演新生代的Eden空间、Survivor空间,或者老年代空间。收集器能够对扮演不同角色的region采用不同的策略进行处理,这样无论是对新创建的对象还是已经存活了一段时间、熬过多次收集的就对象都能取得良好的手机效果。3、 Region中还有一类特殊的Humongous区域,专门用来存储大对象。G1认为只要大小超过了一个Region容量一半的对象即可判定为大对象,对于超过了整个Region容量的超级大对象,将会被存放在N个连续的Humongous区域中,G1的大多数行为都把Humongous区域作为老年代的一部分看待。4、 虽然G1仍然保存着新生代和老年代的概念,但新生代和老年代不在是固定的,他们都是一系列区域(不需要连续)的动态集合。G1收集器之所以能够建立可以测的时间停顿模型是因为他将Region作为单次回收的最小单元,每次收集到的内存空间都是Region大小的整数倍---->G1收集器会跟踪各个Region里面垃圾堆积的价值大小,价值即回收所获得的空间的大小以及回收所需要时间的经验值,然后再后台维护一个优先级列表,每次根据用户设计允许的收集停顿时间,优先处理回收价值收益最大的那些Region
- G1的垃圾回收大致可以划分为四个步骤:
- 初始标记(Initial Marking):仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS指针的值,让下一阶段用户线程并发运行时,能正确地在可用的Region中分配新对象。这个阶段需要停顿线程,但耗时很短,而且是借用进行Minor GC的时候同步完成的,所以G1收集器在这个阶段实际并没有额外的停顿
- 并发标记( Concurrent Marking):从GC Root开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行。当对象图扫描完成以后,并发时有引用变动的对象会产生漏标问题,G1中会使用SATB(snapshot-at-the-beginning)算法来解决,后面会详细介绍
- 最终标记(Final Marking):对用户线程做一个短暂的暂停,用于处理并发标记阶段仍遗留下来的最后那少量的SATB记录(漏标对象)
- 筛选回收(Live Data Counting and Evacuation):负责更新Region的统计数据,对各个Region的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划,可以自由选择任意多个Region构成回收集,然后把决定回收的那一部分Region的存活对象复制到空的Region中,再清理掉整个旧Region的全部空间。这里的操作涉及存活对象的移动,是必须暂停用户线程,由多个收集器线程并行完成的。
- 补充:G1为每个Region设计了两个名为TAMS(Top at Mark Start)的指针,把Region中的一部分空间划出来用于并发回收过程中的新对象分配,并发回收时新分配的对象地址都必须在这两个指针位置以上。G1默认在这个地址以上的对象是被隐式标记过的,即默认它们是存活的,不纳入回收范围
8、垃圾收集器的搭配使用
五、类加载机制
|