B树C语言实现-创建、插入、删除

来源:互联网 发布:梦幻诛仙手游软件礼包 编辑:程序博客网 时间:2024/05/22 17:40

1. 课程设计题目标题:  B树的基本操作算法(创建、插入、删除)

问题描述:

 在计算机科学中,B树在查找、访问、插入、删除操作上时间复杂度为O(log2~n),与自平衡二叉查找树不同的是B树对大块数据读写的操作有更优的性能,其通常在数据库和文件系统中被使用。  

对于一棵B树,对其进行创建、插入、删除的基本操作。

2. 算法描述

(1) 总体思路(最初的算法)

一棵m阶的B树,或为空树,或为满足下列特征的m叉树:

 ①、树中每个结点至多有m棵子树;    

 ②、若根结点不是终端结点,则至少有2棵子树;

 ③、除根之外,所有非终端结点至少有棵子树;    

 ④、所有的非终端结点中包含下列信息数据: [n, C0, K0, C1, K1, C2, K2, ...., Kn-1, Cn]         其中:Ki[i=0,1,...,n-1]为关键字,且Ki<Ki+1[i=0, 1, ..., n-2];Ci[i=0,1,...,n]为至上子树根结点的指针,且指针Ci所指子树中所有结点的关键字均小于Ki[i=0,1,...,n-1],但都大于Ki-1[i=1,...,n-1];

数据结构:

(2) 第二版本算法

基本操作之插入的步骤:

B树是从空树起,逐个插入关键字而建立起来的,由于B树结点中的关键字个数num必须>=,因此,每次插入一个关键字不是在树中添加一个终端结点,而是首先在最底层的某个非终端结点中插入一个关键字,若该结点的关键字个数不超过m-1,则插入完成,否则要进行结点的“分裂”。

  假设结点node的关键字个数num>max,则需进行分裂处理,其大体处理流程如下:

  1) 结点node以sidx关键字为分割点,索引(0 ~ sidx-1)关键字继续留在结点node中,索引(sidx+1 ~ num-1)关键字放入新结点node2中

  2) 而索引sidx关键字则插入node->parent中,再将新结点node2作为父结点新插入关键字的右孩子结点

  3) 判断插入node的sidx关键字后,node->parent的关键字个数num是否超过max,如果超过,则以parent为操作对象进行1)的处理;否则,处理结束。

 

 

当结点关键字个数num达到max时,则需要进行“分裂”处理,分割序号为num/2。分裂过程如下:

    ->1) 以序列号idx=num/2为分割点,原结点分裂为2个结点A和B;

    ->2) 原结点无父结点,则新建一个结点P,并将关键字插入到新结点P中;若有父节点就直接把AB作为父节点的子结点

    ->3) 将结点A和B作为结点P的子结点,并遵循B树特征④;

    ->4) 因结点P的结点数未超过max,则分裂结束。

 

(3) 第三版本算法

基本操作之删除的步骤:

假设现有一棵m阶的B树,则单个结点的关键字最大个数max=m-1,关键字最小个数min=。假设被删关键字key为结点node中的第idx个关键字,由B树的特征可知,在删除操作之前,结点node的关键字个数num需满足min <= num <= max)。  

情况1:被删关键字KEY所在结点node为非最底层结点时    

Step1:找到被删关键字KEY在结点node中的位置idx —— 即:node->key[idx]为将被删除的关键字    

Step2:找到以子结点child = node->child[idx]为根节点的子树    

Step3:再找到该子树中的最大关键字KEY2,并将之拿去填充被删关键字KEY的位置,即:node->key[idx] = KEY2。 —— 子树最大关键字MaxKey被拿走后,相当于子树最大关键字的原位置被空缺了出来,也可在一定意义上理解为最终删除的子树中的最大关键字。    

经过思考后可发现:以子结点child = node->child[idx]为根节点的子树中最大关键字一定是在最底层某个结点中,不管要求被删的关键字KEY在哪个结点,均可视为最终被删的关键字都是在最底层结点中,而最底层结点的处理请参考2)的处理流程。

 

  

 情况2:被删关键字KEY所在结点node为最底层结点时    

2.1) 删除操作前,结点node的关键字个数num>时,则进行删除操作后,结点node关键字个数num仍然处在min <= num <= max的范围之中,此时删除操作处理完成;    

2.2) 删除操作前,结点node的关键字个数num=时,则进行删除操作后,结点node的关键字个数num<,显然已经不符合B树的特征,为了维护B树的特征,此时需要进行的处理有2种情况:    

->2.2.1) 如果结点node的兄弟结点brother的结点个数num>时,则结点node可以向brother借用一个结点,但是需要以父结点的关键字为跳板,此时删除操作处理完成;    

->2.2.2) 如果结点node的兄弟结点brother的节点个数num=时,则将node和brother进行合并为一个结点new,同时需要将父结点parent中夹在node和brother之间的关键字插入到新结点new中。如果父结点parent中的一个关键字被插入到了新结点后,父结点parent的关键字个数num>=,则删除操作处理完成; 如果父结点parent的关键字个数num<,则父结点parent此时已经不满足B树特征,则需以父结点为操作对象进行2.2)中的情况判断,并依次类推直至根结点。

3. 数据结构

typedef struct _btree_node_t  
{  
    int num;                      /*关键字个数*/ 
    int *key;                     /* 关键字:所占空间为(max+1) - 多出来的1个空间用于交换空间使用 */  
    struct _btree_node_t **child;  /* 子结点:所占空间为(max+2)- 多出来的1个空间用于交换空间使用 */   
    struct _btree_node_t *parent;  /* 父结点 */  
}btree_node_t;  


typedef struct  
{  
    int max;                /* 单个结点最大关键字个数 - 阶m=max+1 */        
    int min;                /* 单个结点最小关键字个数 min=(m/2)向上取整-1*/         
    int sidx;               /* 分裂索引 = (max+1)/2 */        
    btree_node_t *root;     /* B树根结点地址 */           
}btree_t;  

4. 程序源代码

#include <stdio.h>#include <string.h>#include <stdlib.h>#include <errno.h>typedef struct _btree_node_t  {      int num;                      /*关键字个数*/     int *key;                     /* 关键字:所占空间为(max+1) - 多出来的1个空间用于交换空间使用 */      struct _btree_node_t **child;  /* 子结点:所占空间为(max+2)- 多出来的1个空间用于交换空间使用 */       struct _btree_node_t *parent;  /* 父结点 */  }btree_node_t;  typedef struct  {      int max;                /* 单个结点最大关键字个数 - 阶m=max+1 */            int min;                /* 单个结点最小关键字个数 min=(m/2)向上取整-1*/             int sidx;               /* 分裂索引 = (max+1)/2 */            btree_node_t *root;     /* B树根结点地址 */           }btree_t;  static int btree_merge(btree_t *btree, btree_node_t *node);static int _btree_merge(btree_t *btree, btree_node_t *left, btree_node_t *right, int mid);//节点创建static btree_node_t *btree_creat_node(btree_t *btree)  {      btree_node_t *node = NULL;        node = (btree_node_t *)calloc(1, sizeof(btree_node_t));      if(NULL == node) {          fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));          return NULL;      }        node->num = 0;  //结点关键字个数初始化为0      /* 申请max+1个空间,当关键字个数到达max+1时执行分裂操作 */      node->key = (int *)calloc(btree->max+1, sizeof(int));      if(NULL == node->key) {          free(node), node=NULL;          fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));          return NULL;      }        /* 申请max+2个子节点空间,因为子节点每分裂一次,父节点多一个关键字,所以当父节点需要分裂时,正好是子节点个数为max+2个 */      node->child = (btree_node_t **)calloc(btree->max+2, sizeof(btree_node_t *));      if(NULL == node->child) {          free(node->key);          free(node), node=NULL;          fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));          return NULL;      }        return node;  }  btree_t* btree_creat(int m)  {      btree_t *btree = NULL;        if(m < 3) { //阶数不能小于3阶         fprintf(stderr, "[%s][%d] Parameter 'max' must geater than 2.\n", __FILE__, __LINE__);          return NULL;      }        btree = (btree_t *)calloc(1, sizeof(btree_t));      if(NULL == btree) {          fprintf(stderr, "[%s][%d] errmsg:[%d] %s!\n", __FILE__, __LINE__, errno, strerror(errno));          return NULL;      }        btree->max= m - 1;      btree->min = m/2;      if(0 != m%2) {          btree->min++;      }      btree->min--;  //min=(m/2)向上取整-1    btree->sidx = m/2;  //分裂索引    btree->root = NULL;       return btree;  } //分裂结点static int btree_split(btree_t *btree, btree_node_t *node)  {      int idx = 0, total = 0, sidx = btree->sidx;      btree_node_t *parent = NULL, *newNode = NULL;           while(node->num > btree->max) {            total = node->num;            newNode = btree_creat_node(btree);  //创建一个新结点用来放索引sidx+1开始的关键字        if(NULL == newNode) {                     fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);              return -1;          }              memcpy(newNode->key, node->key + sidx + 1, (total-sidx-1) * sizeof(int));  //把sidx之后的关键字放入新结点中        memcpy(newNode->child, node->child+sidx+1, (total-sidx) * sizeof(btree_node_t *));  //把child[sidx]之后的子结点放到newNode->child中          newNode->num = (total - sidx - 1);  //计算新结点的关键字个数        newNode->parent  = node->parent;    //将node和newNode作为原node父节点的子结点          node->num = sidx;           parent  = node->parent;          if(NULL == parent)  {   //如果node没有父节点                    parent = btree_creat_node(btree);  //新建一个结点作为父节点            if(NULL == parent) {                         fprintf(stderr, "[%s][%d] Create root failed!", __FILE__, __LINE__);                  return -1;              }                       btree->root = parent;   //更新根结点//把node,newNode作为新建父节点的子结点            parent->child[0] = node;  parent->child[1] = newNode;             node->parent = parent;               newNode->parent = parent;                 parent->key[0] = node->key[sidx];  //把分裂索引所在的关键字放到该父节点中            parent->num++;          }                 else {         //如果node原本就有父节点,就直接把key[sidx]插入到父节点中            for(idx=parent->num; idx>0; idx--) {      //找到父节点中比key[sidx]大的最小关键字,把key[sidx]插到该关键字的前面                   if(node->key[sidx] < parent->key[idx-1]) {   //在parent->key中每次找到一个比key[sidx]大的就再比较前一个                          parent->key[idx] = parent->key[idx-1];  //每找到一个,就把该关键字的值,和该关键字下方的右孩子结点向后移一位                    parent->child[idx+1] = parent->child[idx];                      continue;  //继续进行for循环                }                 break; //直到找到比key[sidx]大的最小parent->key索引,//此时的parent->key[idx]表示node->key[sidx]要插入的地方,parent->child[idx+1]是newNode要插入的地方            }                       parent->key[idx] = node->key[sidx];  //插入分裂关键字            parent->child[idx+1] = newNode;      //插入新结点            newNode->parent = parent;                        parent->num++;          }                 //  memset(node->key+sidx, 0, (total - sidx) * sizeof(int));        //  memset(node->child+sidx+1, 0, (total - sidx) * sizeof(btree_node_t *));             /* Change node2's child->parent */        //  for(idx = 0; idx <= newNode->num; idx++) {        //      if(NULL != newNode->child[idx]) {               //          newNode->child[idx]->parent = newNode;        //      }               //  }    memset(node->key+sidx, 0, (total - sidx) * sizeof(int));          memset(node->child+sidx+1, 0, (total - sidx) * sizeof(btree_node_t *)); //将复制给newNode的子结点中的parent指向newNodefor(idx = 0; idx <= newNode->num; idx++) {              if(NULL != newNode->child[idx]) {                         newNode->child[idx]->parent = newNode;              }                 }        node = parent;       }        return 0;  }  static int _btree_insert(btree_t *btree, btree_node_t *node, int key, int idx)  //传入要插入关键字的结点,idx表示比自己大的结点的位置,也就是key要插入的位置{      int i = 0;          for(i=node->num; i>idx; i--) {          node->key[i] = node->key[i-1];  //插入关键字    }        node->key[idx] = key;     node->num++;        if(node->num > btree->max) {  //当该结点关键字个数大于最大关键字个数时,执行分裂操作        return btree_split(btree, node);      }        return 0;  }  //插入操作int btree_insert(btree_t *btree, int key)  {      int idx = 0;  //key索引    btree_node_t *node = btree->root;      if(NULL == node) {  //如果为空树,就创建第一个结点        node = btree_creat_node(btree);          if(NULL == node) {              fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);              return -1;          }          //第一个结点创建成果后,插入key        node->num = 1;           node->key[0] = key;          node->parent = NULL;            btree->root = node;          return 0;      }          while(NULL != node) {          for(idx=0; idx < node->num; idx++) {              if(key == node->key[idx]) {  //如果要插入的数据已经存在就不需要插入                fprintf(stderr, "[%s][%d] The node is exist!\n", __FILE__, __LINE__);                  return 0;              }               else if(key < node->key[idx]) {  //找到第一个比自己大的关键字,没有的话就继续idx++                break;              }          }          //如果该结点存在子结点,此时的idx也表示子结点的索引//子结点索引从0开始//child[idx]<key[idx]<child[idx+1]        if(NULL != node->child[idx]) {  //如果这个关键字有对应的子节点,就进入这个子节点,在这个子节点中执行上述操作            node = node->child[idx];          }          else {              break;  //直到找到一个比自己大的且没有子结点的关键字,执行插入操作,插到这个关键字的前面        }      }         return _btree_insert(btree, node, key, idx);  //执行插入操作}  static int _btree_merge(btree_t *btree, btree_node_t *left, btree_node_t *right, int mid)  {      int m = 0;      btree_node_t *parent = left->parent;        left->key[left->num++] = parent->key[mid];        memcpy(left->key + left->num, right->key, right->num*sizeof(int));      memcpy(left->child + left->num, right->child, (right->num+1)*sizeof(btree_node_t *));      for(m=0; m<=right->num; m++) {          if(NULL != right->child[m]) {              right->child[m]->parent = left;          }      }      left->num += right->num;        for(m=mid; m<parent->num-1; m++) {          parent->key[m] = parent->key[m+1];          parent->child[m+1] = parent->child[m+2];      }        parent->key[m] = 0;      parent->child[m+1] = NULL;      parent->num--;      free(right);        /* Check */      if(parent->num < btree->min) {          return btree_merge(btree, parent);      }        return 0;  }  static int btree_merge(btree_t *btree, btree_node_t *node)  {      int idx = 0, m = 0, mid = 0;      btree_node_t *parent = node->parent, *right = NULL, *left = NULL;       if(NULL == parent) {          if(0 == node->num) {              if(NULL != node->child[0]) {                  btree->root = node->child[0];                  node->child[0]->parent = NULL;              }              else {                  btree->root = NULL;              }              free(node);          }          return 0;      }        for(idx=0; idx<=parent->num; idx++) {          if(parent->child[idx] == node) {              break;          }      }        if(idx > parent->num) {          fprintf(stderr, "[%s][%d] Didn't find node in parent's children array!\n", __FILE__, __LINE__);          return -1;      }      else if(idx == parent->num) {          mid = idx - 1;          left = parent->child[mid];          if((node->num + left->num + 1) <= btree->max) {              return _btree_merge(btree, left, node, mid);          }            for(m=node->num; m>0; m--) {              node->key[m] = node->key[m - 1];              node->child[m+1] = node->child[m];          }          node->child[1] = node->child[0];            node->key[0] = parent->key[mid];          node->num++;          node->child[0] = left->child[left->num];          if(NULL != left->child[left->num]) {              left->child[left->num]->parent = node;          }            parent->key[mid] = left->key[left->num - 1];          left->key[left->num - 1] = 0;          left->child[left->num] = NULL;          left->num--;          return 0;      }            mid = idx;      right = parent->child[mid + 1];      if((node->num + right->num + 1) <= btree->max) {          return _btree_merge(btree, node, right, mid);      }        node->key[node->num++] = parent->key[mid];      node->child[node->num] = right->child[0];      if(NULL != right->child[0]) {          right->child[0]->parent = node;      }        parent->key[mid] = right->key[0];      for(m=0; m<right->num; m++) {          right->key[m] = right->key[m+1];          right->child[m] = right->child[m+1];      }      right->child[m] = NULL;      right->num--;      return 0;  }  static int _btree_delete(btree_t *btree, btree_node_t *node, int idx)  {      btree_node_t *orig = node, *child = node->child[idx];         while(NULL != child) {          node = child;          child = node->child[child->num];      }        orig->key[idx] = node->key[node->num - 1];        node->key[--node->num] = 0;      if(node->num < btree->min) {          return btree_merge(btree, node);      }        return 0;  }  int btree_delete(btree_t *btree, int key)  {      int idx = 0;      btree_node_t *node = btree->root;          while(NULL != node) {          for(idx=0; idx<node->num; idx++) {              if(key == node->key[idx]) {                  return _btree_delete(btree, node, idx);              }              else if(key < node->key[idx]) {                  break;              }          }            node = node->child[idx];      }        return 0;  }  void Inorder(btree_node_t *root,int deep){    int i,j,k,a=1;    if(root != NULL)    {       if(deep){        printf("\n");       }       for(j = 0;j < deep;j++){        printf("---");         }       for(i = 0; i <= root->num;i++){           if(a){        printf("< %d | ",root->num);        for( k = 0;k < root->num;k++){            printf("%d ",root->key[k]);        }        a--;        printf(">");          }        Inorder(root->child[i],deep+1);       }       printf("\n");    }}int main(){   btree_t *bt;   int i;   int a[21]={3,4,44,12,67,98,32,43,24,100,34,55,33,13,25,8,5,41,77,200};   bt = btree_creat(4);   for(i = 0;i < 20;i++){    printf("insert %d: %d\n",i+1,a[i]);    btree_insert(bt,a[i]);    Inorder(bt->root,0);    printf("\n");   }   for(i = 0;i < 10;i++){    printf("delete %d: %d\n",i+1,a[i]);    btree_delete(bt,a[i]);    Inorder(bt->root,0);   }   return 0;}



阅读全文
0 0
原创粉丝点击