深入理解Java虚拟机

JVM内存结构

Java虚拟机的内存空间分为五个部分:

  • 程序计数器(PC寄存器)
  • Java虚拟机栈(Java栈)
  • 本地方法栈(C栈)
  • 方法区

程序计数器(PC寄存器)

定义

程序计数器一块较小的内存空间,是当前线程正在执行的那条字节码指令的地址。
如果当前线程正在执行的是一个本地方法,那么此时程序计数器为Undefined。

作用

字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制。
在多线程的情况下,程序计数器记录的是当前线程正在执行的位置,从而当线程切换回来时,就知道上次线程执行到哪儿了。

特点

  • 是一块较小的内存空间
  • 线程私有,每条线程都有自己的程序计数器
  • 生命周期:随着线程的创建而创建,随着线程的结束而销毁
  • 是唯一一个不会出现OutOfMemeryError的内存区域

Java虚拟机栈(Java栈)

定义

Java虚拟机栈是描述Java运行方法过程的内存模型。

作用

Java虚拟机栈为每一个即将运行的Java方法创建一块叫做“栈帧”的区域,用于存放该方法运行过程中的一些信息,例如:

  • 局部变量表
  • 操作数栈
  • 动态链接
  • 方法出口信息
  • ……

特点

  • 局部变量表随着栈帧的创建而创建,它的大小在编译时确定,创建时只需分配事先规定的大小即可。在方法运行过程中,局部变量表的大小不会发生改变。

  • Java虚拟机栈会出现两种异常:OutOfMemeryError和StackOverFlowError。如果Java虚拟机栈不允许动态扩展,那么当线程请求的深度超过当前Java虚拟机栈的最大深度时,会抛出StackOverFlowError异常。如果允许动态扩展,那么当线程请求栈时内存用完了,无法再动态扩展时,会跑出OutOfMemeryError异常。出现StackOverFlowError异常时,内存空间可能还有很多。

  • 生命周期:随着线程的创建而创建,随着线程的结束而销毁

本地方法栈(C栈)

定义

本地方法栈是描述本地方法运行过程的内存模型。由于本多本地方法都是由C语言实现的,所以它通常又叫C栈。它与Java虚拟机栈实现的功能类似。

作用

本地方法栈是为JVM运行本地方法创建一块“栈帧”的区域,用于存放该方法运行过程中的一些信息,例如:

  • 局部变量表
  • 操作数栈
  • 动态链接
  • 方法出口信息
  • ……

特点

  • 与Java方法栈类似,也会出现两种常见异常:OutOfMemeryError和StackOverFlowError。
  • 生命周期:随着线程的创建而创建,随着线程的结束而销毁。

需要注意的是:如果Java虚拟机本身不支持Native方法,或是本身不依赖于传统栈,那么可以不提供本地方法栈。如果支持本地方法栈,那么这个栈一般会在线程创建时按线程分配。

定义

堆是用来存放对象的内存空间。几乎所有的对象都存储在堆中。

作用

存放对象。

特点

  • 线程共享,整个Java虚拟机中只有一个堆,所有的线程都访问同一个堆。
  • 在虚拟机启动时创建
  • 是垃圾回收的主要场所
  • 进一步可以分为:新生代和老年代

不同的区域存放不同生命周期的对象,这样可以根据不同的区域使用不同的垃圾回收算法,更具有针对性。
堆的大小既可以固定,也可以扩展。对于主流的虚拟机,堆的大小是可扩展的,因此当线程请求分配内存,但堆已满,且内存无法扩展时,就会跑出OutOfMemeryError异常。

方法区

定义

方法区是堆的一个逻辑部分。

作用

方法区主要用于存放以下信息:

  • 已经被虚拟机加载的类信息
  • 常量
  • 静态变量
  • 即时编译器编译后的代码

特点

  • 线程共享。方法区是堆的一个逻辑部分,因此和堆一样,都是线程共享。
  • 永久代。方法区中的信息一般需要长期存在,而且它又是堆的逻辑分区,因此用堆的划分方法,把方法区称为“永久代”。
  • 内存回收效率低。方法区中的信息一般需要长期存在,回收一遍之后可能只有少量信息无效。主要回收目标是:对常量池的回收、对类型的卸载。

方法区中存放常量,常量存放在运行时常量池中。当类被Java虚拟机加载后,class文件中的常量就存在放方法区中的常量运行池中。在运行期间,可以向常量池中添加新的常量。

直接内存(堆外内存)

直接内存是除Java虚拟机之外的内存,但也有可能被Java使用。

直接内存与堆内存比较

  • 直接内存申请空间耗费更高的性能
  • 直接内存读取IO的性能要优于普通的堆内存
  • 直接内存作用链:本地IO->直接内存->本地IO
  • 堆内存作用链:本地IO->直接内存->非直接内存->直接内存->本地IO

在配置Java虚拟机参数时,会根据实际内存设置-Xmx等参数信息,但经常忽略直接内存,使得各个区域内存总和大于物理内存限制,从而导致动态扩展时出现OutOfMemeryError异常。

HotSpot虚拟机对象

HotSpot是目前比较主流的Java虚拟机之一。在HotSpot中,对象的内存布局分为三个区局:

  • 对象头(Header)
  • 实例数据(Instance Data)
  • 对齐填充(Padding)

对象头

对象头记录了对象在运行过程中所需要使用的一些数据:
哈希码
GC分代年龄
锁状态标识
线程持有的锁
偏向线程ID
偏向时间戳

对象头可能包含类型指针,通过该指针能确定对象属于哪个类。如果对象是一个数组,那么对象头还会包括数组长度。

实例数据

实例数据就是成员变量的值,其中包括父类成员变量和本类成员变量。

对齐填充

对齐填充是用于确保对象的总长度为8字节的整数倍。
HotSpot虚拟机的自动内存管理系统要求对象的大小必须是8字节的整数倍,而对象头部分正好是8字节的整数倍(1倍或2倍)。因此当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

注意:对齐填充并不是必然存在,也没有特别的含义,它仅仅只是起到占位符的作用。

对象的创建过程

主要分为三步:

  • 类加载检查
  • 为新生对象分配内存
  • 初始化

类加载检查

虚拟机在解析class文件时,如果遇到一条new指令,首先它回去检查常量池中是否有这个类的符号引用,并且检查这个符号引用所代表的类是否已被解析、加载和初始化过。如果没有,那么必须先执行相应的类加载过程。

为新生对象分配内存

对象所需的内存大小在类加载完成后便可以完全确定,接下来从内存中划分一块对应大小的内存空间给新的对象。分配堆中内存有两种方式:

  • 指针碰撞
    如果Java堆中内存绝对规整(说明采用的是“复制算法”或“标记整理法”),空闲内存和已使用内存中间放着一个指针作为分界点指示器,那么分配内存时只需要把指针指向空闲内存挪动一段与对象大小一样的距离,这种分配方式称为指针碰撞。

  • 空闲列表
    如果Java堆中内存不规整,已使用的内存和空闲内存交错(说明采用的是“标记清除法”),此时没法简单进行指针碰撞,VM必须维护一个列表,记录其中哪些内存空闲可用。分配内存时从空闲列表中找到一块足够大的内存空间划分给对象实例。这种分配方式称为空闲列表。

初始化

分配完对象内存后,为对象中的成员变量赋上初始值,设置对象头信息,调用对象的构造函数方法进行初始化。
至此,整个对象的创建过程就完成了。

对象的访问方式

所有对象的存储空间都是在堆中分配的,但是这个对象的引用却是在堆栈中分配的。也就是说在建立一个对象时两个地方都分配内存,在堆中分配的内存实际建立这个对象,而在堆栈中分配的内存只是一个指向这个堆对象的引用而已。那么根据引用存放的地址类型的不同,对象有两种不同的访问方式:

  • 句柄访问方式
    堆中需要有一块叫做“句柄池”的内存空间,句柄中包含了对象实例数据与类型数据各自的具体地址信息。引用类型的变量存放的是该对象的句柄地址。访问对象时,首先需要通过引用类型的变量找到该对象的句柄,然后根据句柄中对象的地址找到对象。

  • 直接指针访问方式
    引用类型的变量直接存放对象的地址,从而不需要句柄池,通过引用能够直接访问对象。但对象所在的内存空间需要额外的策略存储对象所属的类信息的地址。

HotSpot虚拟机采用的是第二种方式,即直接指针访问方式,只需要一次寻址操作,所以在性能上比句柄访问方式快一倍。

垃圾收集策略与算法

对于程序计数器、Java方法栈、本地方法栈,它们的生命周期都是随着线程的创建而创建,随着线程的结束而销毁,因此不用考虑垃圾回收。而对于Java堆和方法区,我们只有在程序运行期间才能知道会创建哪些对象,这部分内存的创建和分配都是动态的,垃圾收集器关注的就是这部分内存。

判断对象是否存活

如果一个对象不被任何对象或变量引用,那么它就是无效对象,需要被回收。

  • 引用计数法
    在对象头维护一个counter计数器,对象被引用一次则计数加1,若引用失效则计数减1。当计数器为0时,就认为该对象无效。

  • 可达性分析法
    所有和GC Roots直接或间接关联的对象都是有效对象,和GC Roots没有关联的对象就是无效对象。

GC Roots是指:

  • Java虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 本地方法栈中引用的对象
  • 方法区中常量引用的对象
  • 方法区中类静态属性引用的对象

GC Roots中并不包括堆中对象所引用的对象,这样就不会有循环引用的问题。

引用类型

包括四种引用类型:

  • 强引用
  • 软引用
  • 弱引用
  • 虚引用

回收堆中无效的对象

对于可达性分析法中不可达的对象,也并不是没有存活的可能。

回收方法区内存

方法区中主要清除两种垃圾:

  • 废弃常量
    只要常量池中的常量不被任何变量或对象引用,那么这些常量就会被清除掉。

  • 无用的类
    判定一个类无用条件较为苛刻。需要满足:

    • 该类中的对象已经被清除掉
    • 加载该类的ClassLoader已经被回收
    • 该类的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

垃圾收集算法

根据对象存活周期的不同,将内存划分为几块。一般是把 Java 堆分为新生代和老年代。
新生代:复制算法
老年代:标记-清除算法、标记整理算法

复制算法(新生代)

原理:将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块内存用完,需要进行垃圾收集时,就将存活者的对象复制到另一块上面,然后将第一块内存全部清除。
优点:不会有内存碎片的问题。
缺点:内存缩小为原来的一半,浪费空间。
为了解决空间利用率问题,可以将内存分为三块: Eden、From Survivor、To Survivor,比例是 8:1:1,每次使用 Eden 和其中一块 Survivor。回收时,将 Eden 和 Survivor 中还存活的对象一次性复制到另外一块 Survivor 空间上,最后清理掉 Eden 和刚才使用的 Survivor 空间。这样只有 10% 的内存被浪费。

标记-清除算法(老年代)

原理:判断哪些数据需要被删除并对它们进行标记,然后清除被标记的数据。
不足:
效率问题:标记和清除两个过程的效率都不高。
空间问题:标记清除之后会产生大量不连续的内存碎片,碎片太多可能导致以后需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

标记-整理算法(老年代)

原理:在回收垃圾前,首先将废弃对象做上标记,然后将未标记的对象移到一边,最后清空另一边区域即可。

HotSpot垃圾收集器

新生代垃圾收集器:Serial 垃圾收集器(单线程)、ParNew 垃圾收集器(多线程)、Parallel Scavenge 垃圾收集器(多线程)
老年代垃圾收集器:Serial Old 垃圾收集器(单线程)、Parallel Old 垃圾收集器(多线程)、CMS 垃圾收集器
G1 通用垃圾收集器:它没有新生代和老年代的概念,而是将堆划分为一块块独立的 Region。

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2015-2023 henrrywan

请我喝杯咖啡吧~

支付宝
微信