10、三种JVM
- Sun公司 HotSpot java Hotspot?64-Bit server vw (build 25.181-b13,mixed mode)
- BEA
JRockit - IBM
J9 VM
11、堆
堆内存中还要细分为三个区域:
GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,OOM,堆内存不够!
12.新生区、养老区
- 新生区是类诞生,成长,消亡的区域,一个类在这里产生,应用,最后被垃圾回收器收集,结束生命。
- 新生区又分为两部分:伊甸区(Eden Space)和幸存者区(Survivor Space),所有的类都是在伊甸区被new出来的,幸存区有两个:0区 和 1区,当伊甸园的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(Minor GC)。将伊甸园中的剩余对象移动到幸存0区,若幸存0区也满了,再对该区进行垃圾回收,然后移动到1区,那如果1区也满了呢?(这里幸存0区和1区是一个互相交替的过程)再移动到养老区,若养老区也满了,那么这个时候将产生MajorGC(Full GC),进行养老区的内存清理,若养老区执行了Full GC后发现依然无法进行对象的保存,就会产生OOM异常 “OutOfMemoryError ”。如果出现 java.lang.OutOfMemoryError:java heap space异常,说明Java虚拟机的堆内存不够,原因如下:
- Java虚拟机的堆内存设置不够,可以通过参数 -Xms(初始值大小),-Xmx(最大大小)来调整。
- 代码中创建了大量大对象,并且长时间不能被垃圾收集器收集(存在被引用)或者死循环。
13.永久区(Perm)
- 永久存储区是一个常驻内存区域,用于存放JDK自身所携带的Class,Interface的元数据,也就是说它存储的是运行环境必须的类信息,被装载进此区域的数据是不会被垃圾回收器回收掉的,关闭JVM才会释放此区域所占用的内存。
- 如果出现 java.lang.OutOfMemoryError:PermGen space(永久区OOM),说明是 Java虚拟机对永久代Perm内存设置不够。一般出现这种情况,都是程序启动需要加载大量的第三方jar包,
- 例如:在一个Tomcat下部署了太多的应用。或者大量动态反射生成的类不断被加载,最终导致Perm区被占满。
注意:
- JDK1.6之前: 有永久代,常量池1.6在方法区
- JDK1.7: 有永久代,但是已经逐步 “去永久代”,常量池1.7在堆
- JDK1.8及之后:无永久代,常量池1.8在元空间
熟悉三区结构后方可学习JVM垃圾回收机制
- 实际而言,方法区(Method Area)和堆一样,是各个线程共享的内存区域,它用于存储虚拟机加载的:类信息+普通常量+静态常量+编译器编译后的代码,虽然JVM规范将方法区描述为堆的一个逻辑部分(逻辑上存在,物理上不存在),但它却还有一个别名,叫做Non-Heap(非堆),目的就是要和堆分开。
- 对于HotSpot虚拟机,很多开发者习惯将方法区称之为 “永久代(Parmanent Gen)”,但严格本质上说两者不同,或者说使用永久代实现方法区而已,永久代是方法区(相当于是一个接口interface)的一个实现,Jdk1.7的版本中,已经将原本放在永久代的字符串常量池移走。
- 常量池(Constant Pool)是方法区的一部分,Class文件除了有类的版本,字段,方法,接口描述信息外,还有一项信息就是常量池,这部分内容将在类加载后进入方法区的运行时常量池中存放!
堆的组成图
14.堆内存调优
- -Xms:设置初始分配大小,默认为物理内存的 “1/64”。
- -Xmx:最大分配内存,默认为物理内存的 “1/4”。
- -XX:+PrintGCDetails:输出详细的GC处理日志。
测试一
public class TestHeap {
public static void main(String[] args) {
long max = Runtime.getRuntime().maxMemory();
long total = Runtime.getRuntime().totalMemory();
System.out.println("max=" + max + "字节\t" + (max/(double)1024/1024) + "MB");
System.out.println("total=" + total + "字节\t" + (total/(double)1024/1024) + "MB");
}
}
-
发现,默认的情况下分配的内存是总内存的 1/4,而初始化的内存为 1/64 ! -
修改VM参数再次运行 -Xms1024m -Xmx1024m -XX:+PrintGCDetails
运行结果 大概计算分析一下新生代和老年代的空间 结论:发现等于初始化和最大的物理内存,验证了元空间逻辑存在,物理不存在
测试二(测试OOM)
-Xms8m -Xmx8m -XX:+PrintGCDetails
-
代码
public class TestHeap {
public static void main(String[] args) {
String str = "suneiLY";
while (true) {
str += str + new Random().nextInt(88888888)
+ new Random().nextInt(999999999);
}
}
}
-
测试结果
- 这是一个young 区域撑爆的JAVA 内存日志,其中 PSYoungGen 表示 youngGen分区的变化1536k 表示 GC之前的大 小。
- 488k 表示GC 之后的大小。
- 整个Young区域的大小从 1536K 到 672K , young代的总大小为 7680K。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v3NXNTyC-1641219766720)(JVM入门.assets/image-20211021173816330.png)]
- user – 总计本次 GC 总线程所占用的总 CPU 时间。
- sys – OS 调用 or 等待系统时间。
- real – 应用暂停时间。
- 如果GC 线程是 Serial Garbage Collector 串行搜集器的方式的话(只有一条GC线程,), real time 等于user 和 system 时间之和。
- 通过日志发现Young的区域到最后 GC 之前后都是0,old 区域 无法释放,最后报堆溢出错误。
发生OOM内存溢出,解决方法 A、 尝试扩大堆内存看结果 B、 分析内存,看一下哪个地方出现问题(专业工具)
JProfiler工具分析OOM原因
JProfiler下载地址
只需要在VM参数中添加此参数,就会Dump下来文件,然后通过JProfiler进行判断错误
-XX:+HeapDumpOnOutOfMemoryError
- 分析Dump内存文件,快速定位内存泄漏
- 获得堆中的数据
- 获得大的对象
- 查看线程,定位错误的行数
1、内存溢出:(Out Of Memory—-OOM) 系统已经不能再分配出你所需要的空间,比如系统现在只有1G的空间,但是你偏偏要2个G空间,这就叫内存溢出 例子:一个盘子用尽各种方法只能装4个果子,你装了5个,结果掉倒地上不能吃了。这就是溢出。比方说栈,栈满时再做进栈必定产生空间溢出,叫上溢,栈空时再做退栈也产生空间溢出,称为下溢。就是分配的内存不足以放下数据项序列,称为内存溢出。说白了就是我承受不了那么多,那就报错。
2、内存泄漏: (Memory Leak) 强引用所指向的对象不会被回收,可能导致内存泄漏,虚拟机宁愿抛出OOM也不会去回收他指向的对象,意思就是你用资源的时候为他开辟了一段空间,当你用完时忘记释放资源了,这时内存还被占用着,一次没关系,但是内存泄漏次数多了就会导致内存溢出
其他文章链接
15、GC
GC的作用域
JVM在进行GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
GC分两种类:轻GC(普通的GC)、重GC(全局GC)
GC题目:
- JVM是内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些?说说他们的特点
- GC的算法有哪些?标记清除法、复制算法、标记整理算法、分代收集算法、引用计数法,怎么用的?
- 轻GC和重GC分别在什么时候发生
说明(新对象在堆中可能遭遇的过程):一个对象在伊甸园区被new出来,当伊甸园区对象的数量满了会调用轻GC来清理伊甸园区的对象,没有被清理掉的对象会进入到幸存from区,如果满了会和幸存to区(谁空谁是to)互换,当一个对象经历了15次GC还没有死的话,对象会进入到养老区,当养老去满了的时候会调用重GC来清理垃圾
16、GC四大算法
引用计数法
- 每个对象有一个引用计数器,当对象被引用一次则计数器加1,当对象引用失效一次,则计数器减1,对于计数器为0的对象意味着是垃圾对象,可以被GC回收。
- 目前虚拟机基本都是采用可达性算法,从GC Roots 作为起点开始搜索,那么整个连通图中的对象边都是活对象,对于GC Roots 无法到达的对象变成了垃圾回收对象,随时可被GC回收。
缺点:
- 每次对象赋值均要维护引用计数器,且计数器本身也有一定的消耗
- 较难处理循环引用
JVM的实现一般不采用这种方式
复制算法
年轻代中使用的是Minor GC,采用的就是复制算法(Copying)
Minor GC过程:复制->清空->互换
-
复制 eden、Survivor From区 复制到Survivor To区,年龄+1 首先,当Eden区满的时候会触发第一次GC,把还存活的对象拷贝到survivorFrom区,当Eden区再次触发GC的时候,会扫描Eden区和From区域,对这两个区域进行垃圾回收,经过这次垃圾回收后还存活的对象,则直接复制到To区(如果有对象的年龄已经达到了去往老年代的标准,则这些达到标准的对象将会被复制到老年代区),同时把这些对象的年龄+1 -
清空 清空Eden、survivorFrom区。然后,清空Eden和SuriviorFrom中的对象,也即是复制之后有交换。在幸存区中谁空谁是to。 -
SurvivorTo和SurvivorFrom互换 最后,Survivor To和Survivor From互换,原来Survivor To成为下一次GC的Survivor From区,部分对象会在From和To区中复制来复制去的,如此交换15次(由JVM参数MaxTenuringThreshold决定的,这个参数默认值就是15),最终如果还是存活的对象,就把这些存活的对象存入到老年代区域。 -
-XX:MaxTenuringThreshold 任期门槛=>设置对象在新生代中存活的次数
原理解释
-
年轻代中的GC,主要是复制算法(Copying) -
HotSpot JVM 把年轻代分为了三部分:一个 Eden 区 和 2 个Survivor区(from区 和 to区)。默认比例为 8:1:1,一般情况下,新创建的对象都会被分配到Eden区(一些大对象特殊处理),这些对象经过第一次Minor GC后,如果仍然存活,将会被移到Survivor区,对象在Survivor中每熬过一次Minor GC , 年龄就会增加1岁,当它的年龄增加到一定程度时,就会被移动到年老代中,因为年轻代中的对象基本上都是朝生夕死,所以在年轻代的垃圾回收算法使用的是复制算法!复制算法的思想就是将内存分为两块,每次只用其中一块,当这一块内存用完,就将还活着的对象复制到另外一块上面。复制算法不会产 生内存碎片! -
在GC开始的时候,对象只会在Eden区和名为 “From” 的Survivor区,Survivor区“TO” 是空的,紧接着进行GC,Eden区中所有存活的对象都会被复制到 “To”,而在 “From” 区中,仍存活的对象会更具他们的年龄值来决定去向。 -
年龄达到一定值的对象会被移动到老年代中,没有达到阈值的对象会被复制到 “To 区域”,经过这次GC后,Eden区和From区已经被清空,这个时候, “From” 和 “To” 会交换他们的角色, 也就是新的 “To” 就是GC前的“From” , 新的 “From” 就是上次GC前的 “To”。 -
不管怎样,都会保证名为To 的Survicor区域是空的。 Minor GC会一直重复这样的过程。直到 To 区 被填满 ,“To” 区被填满之后,会将所有的对象移动到老年代中。
好处
坏处
复制算法最佳使用场景:对象存活度较低的时候(新生区)
补充
- 大对象直接进入到老年代,原因是新生代的GC算法是复制算法,这样做的目的是避免Eden去和两个Survivor区之间发生大量的内存复制
标记清除算法
- 当堆中的有效内存空间被耗尽的时候,就会停止整个程序(也被称为stop the world),然后进行两项工作,第一项则是标记,第二项则是清除。
- 标记:从引用根节点开始标记所有被引用的对象,标记的过程其实就是遍历所有的GC Roots ,然后将所有GC Roots 可达的对象,标记为存活的对象。
- 清除: 遍历整个堆,把未标记的对象清除。
优点
缺点
-
它的缺点就是效率比较低,需要两次遍历(递归与全堆对象遍历),而且在进行GC的时候,需要停止应用 程序 -
主要的缺点则是这种方式清理出来的空闲内存是不连续的,会产生内存碎片。这点不难理解,我们的死亡对象 都是随机的出现在内存的各个角落,现在把他们清除之后,内存的布局自然乱七八糟,而为了应付 这一点,JVM就不得不维持一个内存空间的空闲列表,这又是一种开销。而且在分配数组对象的时 候,寻找连续的内存空间会不太好找。
标记压缩
对标记清除算法会产生内存碎片进行优化
- 在整理压缩阶段,不再对标记的对象作回收,而是通过所有存活对象都像一端移动,然后直接清除边界以外的内存。可以看到,标记的存活对象将会被整理,按照内存地址依次排列,而未被标记的内存会被 清理掉,如此一来,当我们需要给新对象分配内存时,JVM只需要持有一个内存的起始地址即可,这比维护一个空闲列表显然少了许多开销。
- 标记、整理算法 不仅可以弥补 标记、清除算法当中,内存区域分散的缺点,也消除了复制算法当中,内存减半的高额代价
标记清除压缩
总结
- 内存效率:复制算法 > 标记清除算法 > 标记压缩算法 (时间复杂度);
- 内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法;
- 内存利用率:标记压缩算法 = 标记清除算法 > 复制算法;
难道就没有一种最优算法吗?
答案: 无,没有最好的算法,只有最合适的算法 。 ==> 分代收集算法
年轻代:(Young Gen)
- 年轻代特点是区域相对老年代较小,对象存活低。
- 这种情况复制算法的回收整理,速度是最快的。复制算法的效率只和当前存活对象大小有关,因而很适用于年轻代的回收。而复制算法内存利用率不高的问题,通过hotspot中的两个survivor的设计得到缓解。
老年代:(Tenure Gen)
- 老年代的特点是区域较大,对象存活率高!
- 标记清除(内存碎片不太多) + 标记压缩是实现
|