互斥同步是一种最常见也是最主要的并发正确性保障手段。 同步是指在多个线程并发访问共享数据时, 保证共享数据在同一个时刻只被一条线程使用。
而互斥是实现同步的一种手段, 临界区(Critical Section) 、 互斥量(Mutex)和信号量(Semaphore)都是常见的互斥实现方式。
在Java里面, 最基本的互斥同步手段就是synchronized关键字, 除了synchronized关键字以外, 自JDK 5起, Java类库中新提供了java.util.concurrent包 ,其中的java.util.concurrent.locks.Lock接口便成了Java的另一种全新的互斥同步手段。
ReentrantLock与synchronized相比增加了一些高级功能, 主要有三项: 等待可中断、 可实现公平锁及锁可以绑定多个条件。
等待可中断:是指当持有锁的线程长期不释放锁的时候, 正在等待的线程可以选择放弃等待, 改为处理其他事情。 可中断特性对处理执行时间非常长的同步块很有帮助。
可实现公平锁:是指多个线程在等待同一个锁时, 必须按照申请锁的时间顺序来依次获得锁; 而非公平锁则不保证这一点, 在锁被释放时, 任何一个等待锁的线程都有机会获得锁。 synchronized中的锁是非公平的, ReentrantLock在默认情况下也是非公平的, 但可以通过带布尔值的构造函数要求使用公平锁。
锁绑定多个条件:一个ReentrantLock对象可以同时绑定多个Condition对象。 在synchronized中, 锁对象的wait()跟它的notify()或者notifyAll()方法配合可以实现一个隐含的条件, 如果要和多于一个的条件关联的时候, 就不得不额外添加一个锁; 而ReentrantLock则无须这样做, 多次调用newCondition()方法即可。
互斥同步面临的主要问题是进行线程阻塞和唤醒所带来的性能开销, 因此这种同步也被称为阻塞同步。
另一种基于冲突检测的乐观并发策略, 通俗地说就是不管风险, 先进行操作, 如果没有其他线程争用共享数据, 那操作就直接成功了; 如果共享的数据的确被争用, 产生了冲突, 那再进行其他的补偿措施, 最常用的补偿措施是不断地重试, 直到出现没有竞争的共享数据为止。 这种乐观并发策略的实现不再需要把线程阻塞挂起, 因此这种同步操作被称为非阻塞同步。比较常见的就是比较并交换(CAS)。
CAS指令需要有三个操作数, 分别是内存位置(在Java中可以理解为变量的内存地址, 用V表示) 、 旧的预期值(用A表示) 和准备设置的新值(用B表示) 。 CAS指令执行时, 当且仅当V符合A时, 处理器才会用B更新V的值, 否则它就不执行更新。 但是, 不管是否更新了V的值, 都会返回V的旧值, 上述的处理过程是一个原子操作, 执行期间不会被其他线程中断。
同步只是保障存在共享数据争用时正确性的手段, 如果能让一个方法本来就不涉及共享数据, 那它自然就不需要任何同步措施去保证其正确性, 因此会有一些代码天生就是线程安全的:
可重入代码:是指可以在代码执行的任何时刻中断它, 转而去执行另外一段代码(包括递归调用它本身) , 而在控制权返回后, 原来的程序不会出现任何错误, 也不会对结果有所影响。 这意味着相对线程安全来说, 可重入性是更为基础的特性, 它可以保证代码线程安全, 即所有可重入的代码都是线程安全的, 但并非所有的线程安全的代码都是可重入的。可重入代码有一些共同的特征, 例如, 不依赖全局变量、 存储在堆上的数据和公用的系统资源,用到的状态量都由参数中传入, 不调用非可重入的方法等。
线程本地存储:如果一段代码中所需要的数据必须与其他代码共享, 那就看看这些共享数据的代码是否能保证在同一个线程中执行。 如果能保证, 就可以把共享数据的可见范围限制在同一个线程之内, 这样, 无须同步也能保证线程之间不出现数据争用的问题。例如:每一个线程的Thread对象中都有一个ThreadLocalMap对象, 这个对象存储了一组以ThreadLocal.threadLocalHashCode为键, 以本地线程变量为值的K-V值对, ThreadLocal对象就是当前线程的ThreadLocalMap的访问入口, 每一个ThreadLocal对象都包含了一个独一无二的threadLocalHashCode值, 使用这个值就可以在线程K-V值对中找回对应的本地线程变量。
HotSpot虚拟机开发团队在这个版本上花费了大量的资源去实现各种锁优化技术,如适应性自旋、锁消除、锁膨胀、轻量级锁、偏向锁等。
为了让线程等待,只需让线程执行一个忙循环(自旋),这项技术就是所谓的自旋锁。自旋等待本身虽然避免了线程切换的开销,但它是要占用处理器时间的,因此,如果锁被占用的时间很短,自旋等待的效果就会非常好,反之,如果锁被占用的时间很长,那么自旋的线程只会白白消耗处理器资源。
锁消除是指虚拟机即时编译器在运行时,对一些代码上要求同步,但是被检测到不可能存在共享数据竞争的锁进行消除。
在编写代码的时候,总是推荐将同步块的作用范围限制得尽量小——只在共享数据的实际作用域中才进行同步,这样是为了使得需要同步的操作数量尽可能变小,如果存在锁竞争,那等待锁的线程也能尽快拿到锁。如果虚拟机探测到有这样一串零碎的操作都对同一个对象加锁,将会把加锁同步的范围扩展(粗化)到整个操作序列的外部。
轻量级锁并不是用来代替重量级锁的,它的本意是在没有多线程竞争的前提下,减少传统的重量级锁使用操作系统互斥量产生的性能消耗。
HotSpot虚拟机的对象头分为两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄等,这部分数据的长度在32位和64位的虚拟机中分别为32bit和64bit,官方称它为“Mark Word”,它是实现轻量级锁和偏向锁的关键。另外一部分用于存储指向方法区对象类型数据的指针,如果是数组对象的话,还会有一个额外的部分用于存储数组长度。
对象头信息是与对象自身定义的数据无关的额外存储成本,考虑到虚拟机的空间效率,Mark Word被设计成一个非固定的数据结构以便在极小的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。例如,在32位的HotSpot虚拟机中对象未被锁定的状态下,Mark Word的32bit空间中的25bit用于存储对象哈希码,4bit用于存储对象分代年龄,2bit用于存储锁标志位,1bit固定为0。
在代码进入同步块的时候,如果此同步对象没有被锁定(锁标志位为“01”状态),虚拟机首先将在当前线程的栈帧中建立一个名为锁记录的空间,用于存储锁对象目前的Mark Word的拷贝。虚拟机将使用CAS操作尝试将对象的Mark Word更新为指向Lock Record的指针。如果这个更新动作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word的锁标志位将转变为“00”,即表示此对象处于轻量级锁定状态,如果这个更新操作失败了,虚拟机首先会检查对象的Mark Word是否指向当前线程的栈帧,如果只说明当前线程已经拥有了这个对象的锁,那就可以直接进入同步块继续执行,否则说明这个锁对象已经被其他线程抢占了。如果有两条以上的线程争用同一个锁,那轻量级锁就不再有效,要膨胀为重量级锁,锁标志的状态值变为“10”,Mark Word中存储的就是指向重量级锁(互斥量)的指针,后面等待锁的线程也要进入阻塞状态。
目的是消除数据在无竞争情况下的同步原语,进一步提高程序的运行性能。如果说轻量级锁是在无竞争的情况下使用CAS操作去消除同步使用的互斥量,那偏向锁就是在无竞争的情况下把整个同步都消除掉,连CAS操作都不做了。
当锁对象第一次被线程获取的时候,虚拟机将会把对象头中的标志位设为“01”,即偏向模式。同时使用CAS操作把获取到这个锁的线程的ID记录在对象的Mark Word之中,如果CAS操作成功,持有偏向锁的线程以后每次进入这个锁相关的同步块时,虚拟机都可以不再进行任何同步操作,当有另外一个线程去尝试获取这个锁时,偏向模式就宣告结束。根据锁对象目前是否处于被锁定的状态,撤销偏向后恢复到未锁定(标志位为“01”)或轻量级锁定(标志位为“00”)的状态,后续的同步操作就如上面介绍的轻量级锁那样执行。
来源:《深入理解Java虚拟机》