互斥问题总结

来源：互联网发布：淘宝名字大全2016款女编辑：程序博客网时间：2024/05/18 02:28

这次写点简单的东西，记得最开始接触“互斥”这个词是在大三去旁听操作系统课时候，当时感觉还是很难理解的。今天正巧看《UNIX环境高级编程》时候又看到它了，就好好做一次总结吧。

1. 为什么需要同步？

上面的图是从《高级编程》中截的图，虽然它是针对线程的，但是这里要说明，不仅仅线程要考虑这个问题，只要涉及到并发的程序，都要考虑同步。比如多进程共享内存，比如某个驱动会同时被打开，而且会被几个进程同时修改驱动中的值或者寄存器......

原理上都是一样的，多线程并发访问是一定要注意的，因为同一进程的多个线程本身就共享进程资源或者说变量的内存。就拿上图来说，我们对i变量的值+1操作，那么这个简简单单的+1操作真正到了CPU上会怎么执行呢？通常分为3步：

(1) 从内存单元读入寄存器

(2) 在寄存器上进行变量值增加

(3) 把新的值写回内存单元

这就导致了上图的问题，A线程在把i从内存读入寄存器改变过程中（还没写回到内存），B线程也对i做了同样操作，以至于最后结果就是读入的都是5，写入的都是6，那么本来我们是要对i增加2次的，实际却增加了1次。这种操作时间问题可能发生在ns级别，但是以当今处理器动辄几GB的速度来说，发生这种情况概率还是很大的。

2.验证试验

下面我们就做实验来实际看看这种情况。

看下程序：

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <pthread.h>#define NUM 40000000pthread_t tid1;pthread_t tid2;unsigned int count1 = 0;unsigned int count2 = 0;unsigned int count = 0;void * thr_fn1(void *arg){while(count1<NUM){count++;count1++;}}void * thr_fn2(void *arg){while(count2<NUM){count++;count2++;}}int main(void){interr;err = pthread_create(&tid1, NULL, thr_fn1, NULL);if (err != 0)perror("can't create thread1");err = pthread_create(&tid2, NULL, thr_fn2, NULL);if (err != 0)perror("can't create thread2");pthread_join(tid1, NULL);pthread_join(tid2, NULL);printf("count = %u, count1 = %u, count2 = %u\n", count, count1, count2);exit(0);}

程序很简单，就是创建两个线程，然后每个线程分别对count增加40000000 值，这个值是我随便选的，只要大一点就行，但是别超了2^32。而count1和count2分别来记录两个线程对count分别增加了多少次，其实有NUM控制就好了，不过为了对比，我们加入这两个变量。主进程创建两个线程后我们用pthread_join函数来等待两个线程执行完毕，并打印三个值比较得出结果。

首先在PC机上看下结果，CPU是双核2.6GHZ的，运行环境是ubuntu，顺便用time命令查看下执行时间：

从上图可以看出，两个线程对count进行总共80000000次累加大概需要2ms多一点，测了6次有2次是有问题的，即count != count1 + count2，概率还是比较大的。

然后我把相同的代码重新编译拿到AM335x（TI A8单核600MHZ）运行，结果如下

这个时间程序耗时就明显长了，需要大概4s，本来我以为单核处理器出错概率会小，没想到运行5次结果居然全是错的。具体为什么会这样没去深究，猜想应该和SMP机制及操作系统线程调度有关。这个结果更证明了线程同步的重要性，尤其是在嵌入式系统中。

3.同步问题解决方案

既然问题都明白了，接下来当然是解决方案了，解决这种同步问题最经典的方案就是锁了，相信大部分人平时都用过。以linux线程库提供的接口，代码改为下面形式。

#define NUM 40000000pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;pthread_t tid1;pthread_t tid2;unsigned int count1 = 0;unsigned int count2 = 0;unsigned int count = 0;void * thr_fn1(void *arg){while(count1<NUM){pthread_mutex_lock(&lock);count++;pthread_mutex_unlock(&lock);count1++;}}void * thr_fn2(void *arg){while(count2<NUM){pthread_mutex_lock(&lock);count++;pthread_mutex_unlock(&lock);count2++;}}

只列出了部分代码，其它的都一样，其实思想很简单，就是在并发访问同一个变量时候，给这个共享变量加锁，保证写操作的原子性即可。那么为什么count1和count2不用加锁呢，因为两个变量本身就只在两个线程中分别操作，所以没必要加锁。

最后来看下结果，问题本身已经解决了，但是这次重点不在结果上，而在程序执行时间上

这是在PC上结果

这是在ARM上结果

加了这个操作后，PC上同一程序运行时间多了10倍，板子上多了6倍。所以加锁操作在保证了并发访问正确性同时，大大增加了程序运行时间。所以我们在多进程共享资源并发访问程序设计时候，需要综合考虑程序的正确性和效率。

0 0