多线程数据同步总结(二)

来源:互联网 发布:淘宝爱逛街客户端 编辑:程序博客网 时间:2024/05/29 02:03

性能问题


凡是涉及到多线程数据同步都会有额外的性能开销。常见的同步方式按照性能开销从小到大(主要是耗时的多少)排序为:volatile读取、volatile写入、Interlocked API、SRWLock、关键段(带旋转锁)、内核对象。


使用内核对象,比如互斥量、信号量等的开销最大,因为这时以切换到内核态,而从用户态切换到内核态,大概需要1000个CPU指令周期。

关键段(CRITICAL_SECTION)使用时最好采用带旋转锁的模式,这样当调用EnterCriticalSection时,会首先使用旋转锁不断的循环,尝试在一段时间内获得对资源的访问权,只有当失败时,才切换到内核态等待。之所以这么做是因为,在多CPU核心的机器上,在需要等待的线程从用户态切换到内核态的过长中(1000个CPU指令周期,可以认为很长),原先占用资源的线程可能已经结束对资源的访问了,这时,刚刚切到内核态去等待(或者正在切换中的内核态....1000个CPU指令周期的原因)的线程又需要切到用户态。。。。这样开销就相当大了。。。所以,可以先让线程循环一段时间,如果这段时间内仍不能获得资源,再切换到内核态等待。

方法是使用InitializeCriticalSectionAndSpinCount(LPCRITICAL_SECTION lpCriticalSection, DWORD dwSpinCount)替换InitializeCriticalSection(LPCRITICAL_SECTION lpCriticalSection)完成CRITICAL_SECTION对象的初始化。第二个参数dwSpinCount是最大旋转次数,按照经验,一般设为4000。但是如果只有一个CPU,系统将忽略第二个参数(因为在单CPU的机器上,如果一个线程一直循环,那么占用资源的线程也没有机会去释放资源的使用权),那么上面两个初始化函数的作用就一样了。。。

原创粉丝点击