Java 线程安全

来源：互联网发布：json数组没有key 编辑：程序博客网时间：2024/06/08 18:43

了解的主要两个点：Java的内存模型[重要]，java的线程同步机制
定义：控制多个线程对某个资源的有序访问或修改
解决主要的问题：JVM有自己的内存模型，屏蔽了底层平台内存管理细节，解决多线程的可见性和有序性。
    Java内存模型规定了jvm有主内存，主内存是多个线程共享的，
    当new一个对象的时候，也被分配到主内存中，每个线程都有自己的工作内存，
         当线程操作某个对象时，执行顺序如下：
             （1）从主存复制变量到当前工作内存(read and load)
              (2) 执行代码，改变共享变量值(use and assign)
              (3) 用工作内存数据刷新主存相关内容(store and write)
   当共享变量在多个线程的工作内存中都有副本时，一个线程修改了这个共享变量，那么其他线程能够看到这个被修改后的值，这就是多线程的可见性问题。
   有序性问题：线程在引用变量时，不能直接从主内存中引用，会从主内存中拷贝一个副本，完成后线程会引用该副本；当同一线程再度引用该字段时，可能重新从主存中获取变量副本，也可能直接引用原来的副本，read load use顺序由JVM实现系统决定。将值给工作内存中的变量副本，完成后会同步到主存储区，至于何时同步，由JVM实现系统决定。

（*）
1. for(int i=0;i<10;i++)
2. a++;
线程有可能只对工作内存中的副本进行赋值,只到最后一次赋值后才同步到主存储区，所以assign,store,weite顺序可以由JVM实现系统决定。
（*）
假设有一个共享变量x，线程a执行x=x+1。
从上面的描述中可以知道x=x+1并不是一个原子操作，它的执行过程如下：
1 从主存中读取变量x副本到工作内存
2 给x加1
3 将x加1后的值写回主存
如果另外一个线程b执行x=x-1，执行过程如下：
1 从主存中读取变量x副本到工作内存
2 给x减1
3 将x减1后的值写回主存
那么显然，最终的x的值是不可靠的。
假设x现在为10，线程a加1，线程b减1，
从表面上看，似乎最终x还是为10，但是多线程情况下会有这种情况发生：
1：线程a从主存读取x副本到工作内存，工作内存中x值为10
2：线程b从主存读取x副本到工作内存，工作内存中x值为10
3：线程a将工作内存中x加1，工作内存中x值为11
4：线程a将x提交主存中，主存中x为11
5：线程b将工作内存中x值减1，工作内存中x值为9
6：线程b将x提交到中主存中，主存中x为9
同样，x有可能为11
每次执行的结果都是不确定的，因为线程的执行顺序是不可预见的。这是java同步产生的根源，synchronized关键字保证了多个线程对于同步块是互斥的，synchronized作为一种同步手段，解决java多线程的执行有序性和内存可见性，而volatile关键字之解决多线程的内存可见性问题。

synchronized关键字
   上面说了，java用synchronized关键字做为多线程并发环境的执行有序性的保证手段之一。当一段代码会修改共享变量，这一段代码成为互斥区或临界区，为了保证共享变量的正确性，synchronized标示了临界区。典型的用法如下：
   1. synchronized(锁){
   2.      临界区代码
   3. }
对于public synchronized void add(int num)这种情况，锁就是这个方法所在的对象。
同理，如果方法是public static synchronized void add(int num)，那么锁就是这个方法所在的class。
理论上，每个对象都可以做为锁，但一个对象做为锁时，应该被多个线程共享，这样才显得有意义。

每个锁对象都有两个队列，一个是就绪队列，一个是阻塞队列，就绪队列存储了将要获得锁的线程，阻塞队列存储了被阻塞的线程，当一个被线程被唤醒 (notify)后，才会进入到就绪队列，等待cpu的调度。当一开始线程a第一次执行account.add方法时，jvm会检查锁对象account 的就绪队列是否已经有线程在等待，如果有则表明account的锁已经被占用了，由于是第一次运行，account的就绪队列为空，所以线程a获得了锁，执行account.add方法。如果恰好在这个时候，线程b要执行account.withdraw方法，因为线程a已经获得了锁还没有释放，所以线程 b要进入account的就绪队列，等到得到锁后才可以执行。
一个线程执行临界区代码过程如下：
1 获得同步锁
2 清空工作内存
3 从主存拷贝变量副本到工作内存
4 对这些变量计算
5 将变量从工作内存写回到主存
6 释放锁
可见，synchronized既保证了多线程的并发有序性，又保证了多线程的内存可见性。

生产者/消费者模式
        生产者/消费者模式其实是一种很经典的线程同步模型，很多时候，并不是光保证多个线程对某共享资源操作的互斥性就够了，往往多个线程之间都是有协作的。
        假设有这样一种情况，有一个桌子，桌子上面有一个盘子，盘子里只能放一颗鸡蛋，A专门往盘子里放鸡蛋，如果盘子里有鸡蛋，则一直等到盘子里没鸡蛋，B专门从盘子里拿鸡蛋，如果盘子里没鸡蛋，则等待直到盘子里有鸡蛋。其实盘子就是一个互斥区，每次往盘子放鸡蛋应该都是互斥的，A的等待其实就是主动放弃锁，B 等待时还要提醒A放鸡蛋。
如何让线程主动释放锁
很简单，调用锁的wait()方法就好。wait方法是从Object来的，所以任意对象都有这个方法。看这个代码片段：
Java代码

   1. Object lock=new Object();//声明了一个对象作为锁
   2.    synchronized (lock) {
   3.        balance = balance - num;
   4.        //这里放弃了同步锁，好不容易得到，又放弃了
   5.        lock.wait();
   6. }

如果一个线程获得了锁lock，进入了同步块，执行lock.wait()，那么这个线程会进入到lock的阻塞队列。如果调用lock.notify()则会通知阻塞队列的某个线程进入就绪队列。
声明一个盘子，只能放一个鸡蛋

Java代码
   1. import java.util.ArrayList;
   2. import java.util.List;
   3.
   4. public class Plate {
   5.
   6.     List<Object> eggs = new ArrayList<Object>();
   7.
   8.     public synchronized Object getEgg() {
   9.         if (eggs.size() == 0) {
10.             try {
11.                 wait();
12.             } catch (InterruptedException e) {
13.             }
14.         }
15.
16.         Object egg = eggs.get(0);
17.         eggs.clear();// 清空盘子
18.         notify();// 唤醒阻塞队列的某线程到就绪队列
19.         System.out.println("拿到鸡蛋");
20.         return egg;
21.     }
22.
23.     public synchronized void putEgg(Object egg) {
24.         if (eggs.size() > 0) {
25.             try {
26.                 wait();
27.             } catch (InterruptedException e) {
28.             }
29.         }
30.         eggs.add(egg);// 往盘子里放鸡蛋
31.         notify();// 唤醒阻塞队列的某线程到就绪队列
32.         System.out.println("放入鸡蛋");
33.     }
34.
35.     static class AddThread extends Thread{
36.         private Plate plate;
37.         private Object egg=new Object();
38.         public AddThread(Plate plate){
39.             this.plate=plate;
40.         }
41.
42.         public void run(){
43.             for(int i=0;i<5;i++){
44.                 plate.putEgg(egg);
45.             }
46.         }
47.     }
48.
49.     static class GetThread extends Thread{
50.         private Plate plate;
51.         public GetThread(Plate plate){
52.             this.plate=plate;
53.         }
54.
55.         public void run(){
56.             for(int i=0;i<5;i++){
57.                 plate.getEgg();
58.             }
59.         }
60.     }
61.
62.     public static void main(String args[]){
63.         try {
64.             Plate plate=new Plate();
65.             Thread add=new Thread(new AddThread(plate));
66.             Thread get=new Thread(new GetThread(plate));
67.             add.start();
68.             get.start();
69.             add.join();
70.             get.join();
71.         } catch (InterruptedException e) {
72.             e.printStackTrace();
73.         }
74.         System.out.println("测试结束");
75.     }
76. }

执行结果：
Html代码

   1. 放入鸡蛋
   2. 拿到鸡蛋
   3. 放入鸡蛋
   4. 拿到鸡蛋
   5. 放入鸡蛋
   6. 拿到鸡蛋
   7. 放入鸡蛋
   8. 拿到鸡蛋
   9. 放入鸡蛋
10. 拿到鸡蛋
11. 测试结束

声明一个Plate对象为plate，被线程A和线程B共享，A专门放鸡蛋，B专门拿鸡蛋。假设
1 开始，A调用plate.putEgg方法，此时eggs.size()为0，因此顺利将鸡蛋放到盘子，还执行了notify()方法，唤醒锁的阻塞队列的线程，此时阻塞队列还没有线程。
2 又有一个A线程对象调用plate.putEgg方法，此时eggs.size()不为0，调用wait()方法，自己进入了锁对象的阻塞队列。
3 此时，来了一个B线程对象，调用plate.getEgg方法，eggs.size()不为0，顺利的拿到了一个鸡蛋，还执行了notify()方法，唤醒锁的阻塞队列的线程，此时阻塞队列有一个A线程对象，唤醒后，它进入到就绪队列，就绪队列也就它一个，因此马上得到锁，开始往盘子里放鸡蛋，此时盘子是空的，因此放鸡蛋成功。
4 假设接着来了线程A，就重复2；假设来料线程B，就重复3。
整个过程都保证了放鸡蛋，拿鸡蛋，放鸡蛋，拿鸡蛋。

volatile关键字
       volatile是java提供的一种同步手段，只不过它是轻量级的同步，为什么这么说，因为volatile只能保证多线程的内存可见性，不能保证多线程的执行有序性。而最彻底的同步要保证有序性和可见性，例如synchronized。任何被volatile修饰的变量，都不拷贝副本到工作内存，任何修改都及时写在主存。因此对于Valatile修饰的变量的修改，所有线程马上就能看到，但是volatile不能保证对变量的修改是有序的。什么意思呢？假如有这样的代码：
   1. public class VolatileTest{
   2.   public volatile int a;
   3.   public void add(int count){
   4.        a=a+count;
   5.   }
   6. }
当一个VolatileTest对象被多个线程共享，a的值不一定是正确的，因为a=a+count包含了好几步操作，而此时多个线程的执行是无序的，因为没有任何机制来保证多个线程的执行有序性和原子性。volatile存在的意义是，任何线程对a的修改，都会马上被其他线程读取到，因为直接操作主存，没有线程对工作内存和主存的同步。所以，volatile的使用场景是有限的，在有限的一些情形下可以使用 volatile 变量替代锁。要使 volatile 变量提供理想的线程安全,必须同时满足下面两个条件:
1)对变量的写操作不依赖于当前值。
2)该变量没有包含在具有其他变量的不变式中
volatile只保证了可见性，所以Volatile适合直接赋值的场景，如
Java代码
   1. public class VolatileTest{
   2.   public volatile int a;
   3.   public void setA(int a){
   4.       this.a=a;
   5.   }
   6. }
在没有volatile声明时，多线程环境下，a的最终值不一定是正确的，因为this.a=a;涉及到给a赋值和将a同步回主存的步骤，这个顺序可能被打乱。如果用volatile声明了，读取主存副本到工作内存和同步a到主存的步骤，相当于是一个原子操作。所以简单来说，volatile适合这种场景：一个变量被多个线程共享，线程直接给这个变量赋值。这是一种很简单的同步场景，这时候使用volatile的开销将会非常小。

JVM的内存，被划分了很多的区域：
1.程序计数器
每一个Java线程都有一个程序计数器来用于保存程序执行到当前方法的哪一个指令。
2.线程栈
线程的每个方法被执行的时候，都会同时创建一个帧（Frame）用于存储本地变量表、操作栈、动态链接、方法出入口等信息。每一个方法的调用至完成，就意味着一个帧在VM栈中的入栈至出栈的过程。如果线程请求的栈深度大于虚拟机所允许的深度，将抛出StackOverflowError异常；如果VM栈可以动态扩展（VM Spec中允许固定长度的VM栈），当扩展时无法申请到足够内存则抛出OutOfMemoryError异常。
3.本地方法栈
4.堆
每个线程的栈都是该线程私有的，堆则是所有线程共享的。当我们new一个对象时，该对象就被分配到了堆中。但是堆，并不是一个简单的概念，堆区又划分了很多区域，为什么堆划分成这么多区域，这是为了JVM 的内存垃圾收集，似乎越扯越远了，扯到垃圾收集了，现在的jvm的gc都是按代收集，堆区大致被分为三大块：新生代，旧生代，持久代（虚拟的）；新生代又分为eden区，s0区，s1区。新建一个对象时，基本小的对象，生命周期短的对象都会放在新生代的eden区中，eden区满时，有一个小范围的 gc（minor gc），整个新生代满时，会有一个大范围的gc（major gc），将新生代里的部分对象转到旧生代里。
5. 方法区
其实就是永久代（Permanent Generation），方法区中存放了每个Class的结构信息，包括常量池、字段描述、方法描述等等。VM Space描述中对这个区域的限制非常宽松，除了和Java堆一样不需要连续的内存，也可以选择固定大小或者可扩展外，甚至可以选择不实现垃圾收集。相对来说，垃圾收集行为在这个区域是相对比较少发生的，但并不是某些描述那样永久代不会发生GC（至少对当前主流的商业JVM实现来说是如此），这里的GC主要是对常量池的回收和对类的卸载，虽然回收的“成绩”一般也比较差强人意，尤其是类卸载，条件相当苛刻。
6.常量池
Class 文件中除了有类的版本、字段、方法、接口等描述等信息外，还有一项信息是常量表(constant_pool table)，用于存放编译期已可知的常量，这部分内容将在类加载后进入方法区（永久代）存放。但是Java语言并不要求常量一定只有编译期预置入 Class的常量表的内容才能进入方法区常量池，运行期间也可将新内容放入常量池（最典型的String.intern()方法）。