Java并发
Java 线程的实现是通过映射到系统的轻量级线程上,轻量级线程有对应系统的内核线程,内核线程的调度由系统调度器来调度的,所以 Java 的线程调度方式取决于系统内核调度器,只不过刚好目前主流操作系统的线程实现都是抢占式的。
Java并发围绕着三个特性入手来保证线程安全:原子性、可见性和有序性。
保证线程安全最常见的做法是利用锁机制,来对共享数据做互斥同步。保证在同一个时刻只有一个线程执行某个方法或者代码块。互斥同步最主要的问题是线程的阻塞和唤醒而带来的性能开销。
volatile是轻量级锁,性能自然比普通的锁性能更好。它保证了共享变量在多线程中的可见性、有序性。但是它只能在一些特定的场景下使用。因为无法保证原子性
为了兼顾原子性以及锁带来的性能问题,Java引入了CAS机制,来实现非阻塞同步(乐观锁),并基于CAS,提供了一套原子工具类。
synchronized
synchronized修饰方法时,锁住的是this对象,如果其中有同类的其他实力对象并不能被锁住,此时可以考虑使用类锁,即synchronized(Xxx.class)的方式来锁住此类。
synchronized的锁升级:
无锁
偏向锁
轻量级锁
重量级锁
Lock和Condition
synchronized缺点:无法通过破坏不可抢占条件来避免死锁。synchronized在申请资源时,如果申请不到,线程会直接进入到阻塞状态,那么线程便无法释放线程已经占有的资源
Lock是一个Java接口,允许类在能够自定义锁行为,来实现一些synchronized所无法实现的功能,来适应一些较为复杂的并发环境。
Lock是用来解决互斥问题
Condition用来解决同步问题
Condition也是一个接口,他为Lock提供了一组同步的方法,比如await(),signal()等方法,对应于synchronized关键字所需要的wait,notify等方法。
ReentrantLock
其实就是一个实现了Lock接口,并支持可重入的锁。
在构造方法中可选是否为公平锁,默认为非公平锁
ReentrantReadWriteLock
实现了ReadWriteLock,即他是一个可重入的读写锁。
维护了一对读写锁,将读写锁分开,有利于提高并发效率。
所有的读写锁都遵守以下三条基本原则:
允许多个线程同时读共享变量;
只允许一个线程写共享变量;
如果一个写线程正在执行写操作,此时禁止读线程读共享变量。
ReentrantReadWriteLock 虽然遵循着允许多个读操作进行,但只允许一个写操作,但是在读写操作的优先级上有着多种不同的实现方式:
写锁释放,但是有写锁和读锁都在等待,应该谁先获得
有线程持有读锁,但是此时有写线程在等待,此时如果有新来的读线程,是否允许插队
读写锁的升降级:正在持有写锁,是否可以降级到读锁。正在持有读锁,是否能够升级到写锁。
StampedLock
支持三种锁方式:写锁,悲观读锁和乐观读
注意这里,用的是“乐观读”这个词,而不是“乐观读锁”,是要提醒你,乐观读这个操作是无锁的,所以相比较 ReadWriteLock 的读锁,乐观读的性能更好一些。
StampedLock支持多个线程申请乐观读的同时,还允许一个线程申请写锁。
但是不支持重入
Todo
有点难,这个有点太复杂了
AQS
AbstractQueuedSynchronizer,简称队列同步器,它是并发锁和很多同步工具类的实现基石。
偏向锁
偏向锁的思想是偏向于第一个获取锁对象的线程,这个线程在之后获取该锁就不再需要进行同步操作,甚至连 CAS 操作也不再需要。
轻量级锁
轻量级锁是相对于传统的重量级锁而言,它 使用 CAS 操作来避免重量级锁使用互斥量的开销。对于绝大部分的锁,在整个同步周期内都是不存在竞争的,因此也就不需要都使用互斥量进行同步,可以先采用 CAS 操作进行同步,如果 CAS 失败了再改用互斥量进行同步。
重量级锁
采用互斥变量的方式实现
可重入锁
可重入锁,顾名思义,指的是线程可以重复获取同一把锁。即同一个线程在外层方法获取了锁,在进入内层方法会自动获取锁。
synchronized是典型的可重入锁,比如:
还有ReentrantLock,ReentrantReadWriteLock
公平锁和非公平锁
公平锁。多线程你找申请锁的顺序来获取锁。
非公平锁。多线程不按照申请锁的顺序来获取锁。
synchronized 只支持非公平锁。
ReentrantLock 、ReentrantReadWriteLock,默认是非公平锁,但支持公平锁
独享锁与共享锁
独享锁与共享锁是一种广义上的说法,从实际用途上来看,也常被称为互斥锁与读写锁。
独享锁 - 独享锁是指 锁一次只能被一个线程所持有。
共享锁 - 共享锁是指 锁可被多个线程所持有。
独享锁与共享锁在 Java 中的典型实现:
synchronized、ReentrantLock只支持独享锁。ReentrantReadWriteLock其写锁是独享锁,其读锁是共享锁。读锁是共享锁使得并发读是非常高效的,读写,写读 ,写写的过程是互斥的
乐观锁和悲观锁
乐观锁与悲观锁不是指具体的什么类型的锁,而是处理并发同步的策略。
悲观锁 - 悲观锁对于并发采取悲观的态度,认为:不加锁的并发操作一定会出问题。悲观锁适合写操作频繁的场景。
乐观锁 - 乐观锁对于并发采取乐观的态度,认为:不加锁的并发操作也没什么问题。对于同一个数据的并发操作,是不会发生修改的。在更新数据的时候,会采用不断尝试更新的方式更新数据。乐观锁适合读多写少的场景。
乐观锁:先进行操作,如果没有其他线程争用共享数据,那么操作便成功了,如果有其他线程争用共享数据,那么就采取弥补措施,如不断的重试,直到成功为止。此时并不会阻塞线程,这种策略也叫非阻塞同步。典型的 自旋锁,CAS机制
悲观锁:悲观锁总是认为,只要不去做正确的同步措施,那么肯定会出现问题。无论共享数据是否真的会出现竞争,它都要进行加锁。典型的synchronized
显示锁和内置锁
内置锁:锁的申请和释放都是由JVM所控制。synchronized,volatile
显示锁:锁的申请和释放都可以由程序所控制。ReentrantLock,ReentrantReadWriteLock
区别:
主动获取锁和释放锁
synchronized不能主动获取锁和释放锁。获取锁和释放锁都是 JVM 控制的。ReentrantLock可以主动获取锁和释放锁。(如果忘记释放锁,就可能产生死锁)。
响应中断
synchronized不能响应中断。ReentrantLock可以响应中断。
超时机制
synchronized没有超时机制。ReentrantLock有超时机制。ReentrantLock可以设置超时时间,超时后自动释放锁,避免一直等待。
支持公平锁
synchronized只支持非公平锁。ReentrantLock支持非公平锁和公平锁。
是否支持共享
被
synchronized修饰的方法或代码块,只能被一个线程访问(独享)。如果这个线程被阻塞,其他线程也只能等待ReentrantLock可以基于Condition灵活的控制同步条件。
是否支持读写分离
synchronized不支持读写锁分离;ReentrantReadWriteLock支持读写锁,从而使阻塞读写的操作分开,有效提高并发性
锁消除和锁粗化
锁消除
JIT编译器在动态编译同步代码块时,借助了一种被称为逃逸分析的技术,来判断同步块使用的锁对象是否只能够被一个线程访问,而没有发布到其他线程。
锁粗化
JIT编译器动态编译时,如果发现几个相邻的同步块使用的是同一个锁实例,那么JIT编译器会把这几个同步块合并为一个大的同步块,从而避免一个线程反复申请、释放同一个锁带来的性能消耗。
自旋锁
互斥同步进入阻塞状态的开销比较大,应该尽量避免。而在很多情况下共享数据被上锁的时间往往只会持续很短的一段时间。自旋锁的思想是让一个线程在请求不到一个共享数据的锁时,执行忙循环(自旋)一段时间,如果这段时间内可以获取锁,那么就可以避免进入阻塞状态。
自旋锁和互斥锁最大的区别是:在一个线程得不到自旋锁时,线程并不会被阻塞,但是互斥锁会进入等待。
相同点时:在任意时刻,两个锁都最多只有一个保持者
锁优化
尽可能的缩小加锁的范围,用来提高并发吞吐
区分读写场景以及资源的访问冲突,考虑使用乐观锁or悲观锁
volatile
volatile是轻量级的 synchronized,它再多处理器开发中保证了共享变量的可见性
被volatile修饰的变量,具备以下特点:
线程可见性。一个线程修改了某个共享变量,另外一个线程能够读到这个修改的值
这里可以理解为,多线程环境一个,一个对象的在多个线程中使用,一个线程改变的值可能在其自己的线程缓存中,而没有真正写入到主存中,从而导致其他的线程看不到其修改的值,而
volatile可以保证这种情况不会发生。具体原理为:针对写操作,他会强制将对缓存的修改立即写入到内存中,而且会导致其他cpu(其他线程)中对应的缓存无效
禁止指令重排序。(happen-before语义)
即在指令重排序时,不会把其前面的指令放到后面,也不会把后面的指令放到前面。
不保证原子性。
volatile可见性和happen-before语义的实现在底层依赖于内存屏障来完成
内存屏障是一组处理器指令,用于实现对内存操作的顺序限制。(感觉类似于流水线中的指令冲突)
这里需要使用的是LoadLoad LoadStore StoreLoad StoreStore
volatile使用场景:
对变量的写操作不依赖当前值
该变量没有包含在具有其他变量的不变式当中。
为保证原子性的话可以考虑使用原子类。
volatile 的使用场景
在不符合以下两点的场景中,仍然要通过加锁来保证原子性:
运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值。
变量不需要与其他状态变量共同参与不变约束。
最常用的场景为:一次写入,到处读取
最经典的应用:
CAS
CAS全称为Compare And Swap,比较并交换。CAS有三个操作数:内存值M,期望值E和更新值U,当且仅当内存值和期望值相同时,将M改为U,否则什么都不做
CAS适用于线程冲突较少的情况。典型的场景时:
原子类
自旋锁
原子类的底层采用Unsafe类提供的CAS操作来实现。Unsafe 的 CAS 依赖的是 JVM 针对不同的操作系统实现的硬件指令 Atomic::cmpxchg。Atomic::cmpxchg 的实现使用了汇编的 CAS 操作,并使用 CPU 提供的 lock 信号保证其原子性
CAS存在的问题
ABA问题
如果一个变量初次读取的时候是 A 值,它的值被改成了 B,后来又被改回为 A,那 CAS 操作就会误认为它从来没有被改变过。
J.U.C 包提供了一个带有标记的原子引用类
AtomicStampedReference来解决这个问题,它可以通过控制变量值的版本来保证 CAS 的正确性。大部分情况下 ABA 问题不会影响程序并发的正确性,如果需要解决 ABA 问题,改用传统的互斥同步可能会比原子类更高效
只能保证一个共享变量的原子性
当对一个共享变量执行操作时,我们可以使用循环 CAS 的方式来保证原子操作,但是对多个共享变量操作时,循环 CAS 就无法保证操作的原子性,这个时候就可以用锁。
从 Java 1.5 开始 JDK 提供了
AtomicReference类来保证引用对象之间的原子性,你可以把多个变量放在一个对象里来进行 CAS 操作
ThreadLocal
ThreadLocal 是一个存储线程本地副本的工具类。为共享变量在每个线程中都创建了一个本地副本,这个副本只能被当前线程访问,其他线程无法访问,那么自然是线程安全的。
下面是一个例子,
这里用ThreadLocal对象来包装一个整型共享变量。这里线程池中的线程都会访问threadLocal对象,并从中获取其值,因为并没有加锁,考虑到不同线程的执行先后问题,最终结果可能不会全都为10,但是由于ThreadLocal的包装,过早执行完的线程在将值存储到threadLocal对象中时,并不会对其他线程从threadLocal中get时的结果。所以此代码最终结果输出全为10。
原理为:每一个Thread中都会有一个ThreadLocalMap的对象,这是一个ThreadLocal类的内部类,在执行threadLocal的set函数时,会将此ThreadLocal对象作为key,被set的值作为value存入到本线程的ThreadLocalMap对象中。从而在每一个Thread中使用ThreadLocal的get方法时只会从本Thread中的ThreadLocalMap中get,而不会和其他线程竞争。
值得注意的是,上面的代码初始化的时候使用了 **匿名内部类的方式重写了ThreadLocal中的initialValue**方法,这个方法会在当前Thread的ThreadLocalMap对象中找不到和此ThreadLocal相等的key时被调用,其返回值作为get的返回值,并向ThreadLocalMap中插入此key和value
Java原子类
原子变量类 比锁的粒度更细,更轻量级,并且对于在多处理器系统上实现高性能的并发代码来说是非常关键的。原子变量将发生竞争的范围缩小到单个变量上。
Java线程池
Executor框架
Executor 框架是一个根据一组执行策略调用,调度,执行和控制的异步任务的框架,目的是提供一种将”任务提交”与”任务如何运行”分离开来的机制。
Executor 框架核心 API 如下:
Executor- 运行任务的简单接口。ExecutorService扩展了Executor接口。扩展能力:支持有返回值的线程;
支持管理线程的生命周期。
ScheduledExecutorService- 扩展了ExecutorService接口。扩展能力:支持定期执行任务。AbstractExecutorService-ExecutorService接口的默认实现。ThreadPoolExecutor- Executor 框架最核心的类,它继承了AbstractExecutorService类。ScheduledThreadPoolExecutor-ScheduledExecutorService接口的实现,一个可定时调度任务的线程池。Executors- 可以通过调用Executors的静态工厂方法来创建线程池并返回一个ExecutorService对象。
Executors其中包含很多方法来创建各种线程池和对象
最核心的类为ThreadPoolExecutors
线程池有五个状态:
RUNNING。接收新任务,也可以处理阻塞队列中的任务
SHUTDOWN。不接受新任务,但是可以处理阻塞队列中的任务。RUNNING状态调用shutdown方法会进入此状态。finalize方法在执行过程中也会调用shutdown方法进入到此状态
STOP。停止状态,不接受新任务,也不会处理队列中的任务,在状态1or状态2调用stop方法时,会中断正在处理任务的线程,并进入到此状态
TIDYING。整理状态。所有任务都已经终止,且workcount为0。进入此状态后,会调用terminated方法进入到TERMINATED状态
TERMINATED。已经终止状态。进入
TERMINATED的条件如下:线程池不是
RUNNING状态;线程池状态不是
TIDYING状态或TERMINATED状态;如果线程池状态是
SHUTDOWN并且workerQueue为空;workerCount为 0;设置
TIDYING状态成功。

尽量不要使用无界限任务队列,在高负载情况下容易出现爆内存,Executors中很多方法都默认采用无界任务队列。
尽量不要使用Executors自带的方法创建线程池:
CachedThreadPool,最大线程数是无界的
FixedThreadPool,阻塞队列是无界的
SingleThreadPool,阻塞队列是无界的
ScheduledThreadPool,最大线程数是无界的
ThreadPoolExecutors 解析
ThreadPoolExecutors 解析核心参数
JUC
JUC的其实是java的一个包,java.util.concurrent,主要是Java并发的支持
整体结构如下:
最底层的为unsafe的包的支持,提供了一系列的native方法,其中包括了很多方法,比如操作内存,操作指针,线程调度、内存屏障等等操作,这些方法是juc底层的支持
JUC的很多并发操作底层都是CAS操作,CAS全称Compare and Set,是一种乐观锁,CAS操作本身是依赖于底层的unsafe提供的原子函数来实现。
原子类,这部分是Java提供的一系列支持原子操作的类,底层实现主要依赖CAS操作和volatile关键字,包括很多:
原子基本类型
AtomicInteger
AtomicBoolean
AtomicLong
原子更新数组
AtomicIntegerArray
AtomicLongArray
AtomicReferenceArray
原子更新引用类型:
AtomicReference
AtomicStampedReference
AtomicMarkableReferce
原子更新字段类:基于反射,原子更新字段的值,这些Updater都是抽象类,在使用时需要先利用静态方法newUpdater()创建一个更新器
AtomicIntegerFieldUpdater
AtomicLongFieldUpdated
AtomicReferenceFieldUpdater
12种原子类主要作用就是为了能够支持原子操作。
前三层的关系为:
**原子类的CAS操作底层实现是使用Unsafe包的方法实现的。**即原子类的某个函数名字是CAS类型的操作,然后底层调用Unsafe包里面的函数。
锁:
LockSupport
LockSupport提供了park和unpark操作来支持AQS,park即阻塞,unpark即释放,即提供了类似加锁和释放锁的操作。
锁核心类AQS
AQS利用Unsafe(提供的CAS操作)和 LockSupport(提供Park和unpark操作)来实现的。
锁
JUC集合
Unsafe、CAS、原子类
这三者的关系可用以下来定义:
原子类的CAS操作底层实现是使用Unsafe包的方法实现的。
锁
LockSupport
LockSupport从名字就可以看出,这是一个Lock的support类,他主要提供了两个操作:
LockSupport.park()
LockSUpport.unpark()
park操作是
AQS
各种锁
ConcurrentReadWriteLock
CopyWriteArrayList
CopyWriteArrayList是ArrayList的一个线程安全的变体,其中所有可变操作(add set)等都是通过对底层数组进行一次新的拷贝来实现的,是Copy On Write的体现
在Java的Collection集合类中存在一个fail-fast错误机制。在使用迭代器遍历一个集合对象时,如果遍历过程中对集合对象的结构进行了修改(增加、删除),则会抛出Concurrent Modification Exception。如下:
这里便会抛出此异常。
在CopyWriteArrayList中,实现了fail-safe机制,即不会抛出Concurrent Modification Exception。CopyWriteArrayList的COWIterator的内部类是通过创建一个本地数组元素的快照,这种快照风格的迭代器方法在创建迭代器时使用了对当时数组的引用。这是一个弱一致性,即类似一个快照,我们在某个时间点创建了一个COWIterator,那么我们在访问这个iterator时,得到的是这个List在创建时间点的元素状态,并不会被后续的状态所影响,所以也就不会抛出上面所说的CME异常。同时这个迭代器上也不允许对迭代器的remove、set和add,这些方法会抛出UnsupportOperationException
在类的实现上,使用了一个可重入锁or仅仅使用一个final Object对象作为 synchronized关键字锁住代码段的形式来实现互斥访问。
上面所说类使用数组的拷贝形式来实现对数组的增加、修改、删除等操作。具体来说,这里使用add,来说明流程:
获取锁(多线程安全访问),获取当前Object数组,获取数组的长度
根据数组长度复制一个新的长度为length + 1的Object数组
设置最后一个元素为我们要添加的元素,释放锁,结束操作
同理,remove方法是复制到一个长度减一的数组上,set虽然只是修改,但仍然是复制到新的数组上,然后对对应的位置修改赋值。
缺陷
写操作都需要进行拷贝数组,会需要内存,如果数组内容较多,可能导致young gc or full gc
不能用于实时读的场景,拷贝数组、新增元素都需要时间,所以调用一个set操作后,读取的数据可能还是旧的,虽然能够做到最终一致性,但是无法满足实时性要求
使用场景
适合读多写少的场景,否则,每次操作都进行copy数组,这是一个相当大的代价
为什么CopyOnWriteArrayList性能会比Vector好?
Vector对单独的add,remove等方法都是在方法上加了synchronized; 并且如果一个线程A调用size时,另一个线程B 执行了remove,然后size的值就不是最新的,然后线程A调用remove就会越界(这时就需要再加一个Synchronized)。这样就导致有了双重锁,效率大大降低,何必呢。于是vector废弃了,要用就用CopyOnWriteArrayList
ConcurrentLinkedQueue
最后更新于
这有帮助吗?