高性能无锁(Lock-free) 内存池

来源：互联网发布：线切割编程例子编辑：程序博客网时间：2024/06/05 03:09

http://blog.csdn.net/jadedrip/article/details/5787388

由于懒惰，一直脱到现在才完成，实在是罪过啊！很快会用它来改写我的无锁容器，嗯，如果我不懒惰的话。

稍微解释一下关键问题：

先分配一块内存，然后将内存划分为等大的内存格。每次调用 alloc 就分配一块内存格出去。

可分配内存是个链表，这个链表被直接贮存在未分配的内存里。换句话说，未被分配的内存格里存放了一个指针，这个指针指向下一个未被分配的空闲内存格。

另外，为了我们分配的内存可以被正确释放，还需要一个链表来贮存我们分配的内存列表，这里我把这个链表贮存在我们分配的内存首部。也就是每块分配的内存，前几个字节保存了下一块内存的指针。

我们通过 cas 争用的一个指针指向了链表头，分配内存的过程就是从链表头摘取一个内存格，而释放的过程就是在链表头挂上内存格（注意，都是链表头，因此只需要争用一个指针）。

设计上希望代码支持 64 位，考虑到64位指针本身就是64位，但是当前系统最高应该只使用了 48位，因此使用剩下的部分来作为 ABA 计数。如果你的程序没有使用 256T 以上就应该没有问题吧，嗯——大概。

内存池的初始大小最好是够大，如果在中途分配，可能由于几个线程同时进程分配内存而一下子分配好几块，由于串联可分配内存的操作是比较费时的，为了节约，我把他们全挂上了，如果你希望节约内存的分配量，可以牺牲 cpu时间，放弃多分配的内存。

这个很快会作为一个库的一个组件发布，这个库暂时被命名为 lugce, 谁有更好的名字可以推荐不？呵呵

照例发表源码：

[cpp] view plain copy
/*  
 * Copyright (C) 2010  Chen Wang ( China ) 
 * Email: jadedrip@gmail.com 
 * 
 * This library is free software; you can redistribute it and/or 
 * modify it under the terms of the GNU Lesser General Public 
 * License as published by the Free Software Foundation; either 
 * version 2.1 of the License, or (at your option) any later version. 
 * 
 * This library is distributed in the hope that it will be useful, 
 * but WITHOUT ANY WARRANTY; without even the implied warranty of 
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU 
 * Lesser General Public License for more details. 
 * 
 * You should have received a copy of the GNU Lesser General Public 
 * License along with this library; if not, write to the Free Software 
 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA 
 */  
#pragma once  
#include <exception>  
#include "lockfree.hpp"  
#if !defined(_MSC_VER) || (_MSC_VER < 1600)  
#   define nullptr NULL  
#endif  
namespace lugce  
{  
    namespace lockfree  
    {  
        template< typename T, int blocksize=255 >  
        class memory_pool  
        {  
            static const int objsize= sizeof(T) < sizeof(intptr_t) ? sizeof(intptr_t) : sizeof(T);  
            static const int64 aba_inc  =0x0001000000000000LL;  // ABA 计数每次需要增加的值  
            static const int64 aba_mark =0xFFFF000000000000LL;  // ABA Mark  
            static const int64 ptr_mark =0x0000FFFFFFFFFFFFLL;      // 指针 Mark  
        public:  
            memory_pool()  
            {  
                char *block=tadem_block();  
                _first_block=block;  
                _free_head.data=reinterpret_cast<intptr_t>(block)+sizeof(intptr_t)+objsize;   // 指向链表头  
            }  
            ~memory_pool()  
            {  
                // 释放内存块  
                char * next=_first_block;  
                do{  
                    char *p=next;  
                    intptr_t x=*(intptr_t*)p;  
                    next=(char*)x;  
                    delete[] p;  
                }while(next);  
            }  
        public:  
            /// 申请内存，返回一个指向新内存的指针  
            T* alloc()  
            {  
                /// 尝试从堆栈中弹出一个空闲索引  
                atomic_int64 nval;  
                atomic_int64 old;  
                for(;;){  
                    old=_free_head;  
                    assert( (_free_head.data & ptr_mark) > 0x10000 );  
                    intptr_t *next=reinterpret_cast<intptr_t*>( _free_head.data & ptr_mark ); // 指向下一块空闲单位的指针  
                    if( *next==0 ){ // 没有空闲，需要创建新块  
                        // 创建新块  
                        create_new_block();  
                        continue;  
                    }  
                    nval.data=( (old.data + aba_inc)  & aba_mark);  
                    nval.data|=int64(*next);    // ABA 计数  
                    //assert( (nval.data & ptr_mark) > 0x10000 );  
                    if( atomic_cas( &_free_head, old.data, nval.data  ) )   
                        break;  
                };  
                return reinterpret_cast<T*>(old.data & ptr_mark);  
            }  
            void free( const T* ptr )  
            {  
                intptr_t *p=(intptr_t*)ptr;  
                atomic_int64 nval;  
                atomic_int64 old;  
                // 尝试将其放回链表  
                do{  
                    old=_free_head;  
                    *p=(intptr_t)(old.data & ptr_mark); // 把内容改为下一个空闲索引  
                    assert(*p > 10000);  
                    nval.data=((old.data + aba_inc) & aba_mark) | (intptr_t)ptr;  
                    assert( (nval.data & ptr_mark) > 0x10000 );  
                }while( !atomic_cas(&_free_head, old.data, nval.data) );  
            }  
        private:  
            /// 创建新的内存块  
            void create_new_block()  
            {  
                char *block=tadem_block();  // 分配内存  
                atomic_intptr_t *p=(atomic_intptr_t*)_first_block;  
                // 尝试挂接到内存块链表  
                while( !atomic_cas( p, 0, intptr_t(block) ) ){  
                    p=(atomic_intptr_t*)(p->data);   // 移动到链表下一位  
                }  
                p=(atomic_intptr_t*)( block+sizeof(intptr_t) ); // 让 p 指向链表尾部  
                // 尝试挂接到空闲内存栈头上  
                atomic_int64 old;  
                atomic_int64 nval;  
                do{  
                    old=_free_head;  
                    p->data=intptr_t(old.data & ptr_mark);       // 让链表尾指向当前尾      
                    intptr_t x=*(intptr_t*)(p->data);  
                    assert( x==0 || x > 10000 );  
                    assert(p->data>10000);  
                    nval.data= ( (old.data + aba_inc) & aba_mark) | reinterpret_cast<int64>(block+sizeof(intptr_t)+objsize);  // 新的下块空闲指向本块  
                    assert( (nval.data & ptr_mark) > 0x10000 );  
                } while( !atomic_cas(&_free_head, old.data, nval.data ) );  
            }  
            /// 创建新内存块，并将内存串联为链表  
            char* tadem_block()  
            {  
                char *block=new char[blocksize * objsize+sizeof(intptr_t)]; // 准备一块内存，注意 new 可能抛出异常  
                char *p=block;  
                *reinterpret_cast<intptr_t*>(p)=0;    // 内存的头是对齐的，我们用来保存下一块内存的地址，以构建内存块链表（用来内存池析构时释放内存块）  
                p+=sizeof(intptr_t);  
                *reinterpret_cast<intptr_t*>(p)=0;    // 接下来的4个字节，同样是对齐的，作为链表的尾部  
                p+=objsize;  
                // 把这块内存做成链表  
                for( int32 i=0; i< blocksize-2; ++i ){  
                    *reinterpret_cast<intptr_t*>(p)=reinterpret_cast<intptr_t>(p)+objsize;  // 内容成为指向下一块的空闲单元的指针  
                    p+=objsize;  
                }  
                *reinterpret_cast<intptr_t*>(p)=reinterpret_cast<intptr_t>(block)+sizeof(intptr_t);     // 最后一块指向尾节点  
                return block;  
            }  
        private:  
            char * _first_block;  
            atomic_int64 _free_head;    // 下一个空闲块的索引  
        };  
    };  
};  

顶0踩

1 0