RRD文件格式分析

来源:互联网 发布:格式化恢复软件 编辑:程序博客网 时间:2024/06/05 13:09
一、 文件格式:

rrd 文件格式大体分为两部分:
1.文件头信息区:

   该区域包含一些版本信息和一些于数据存储区相关的一些信息。例如:RRD的版本号,DS数量,DS名称,DS类型,RRA数量,RRA类型,PDP数据区,CDP数据区,最后更新时间,RRA目前更新到的位置等等信息。

2.数据存储区:

   该区域存储了实际的数据。数据的来源是根据在创建RRD文件时DS的类型及相关RRA定义,并通过相关的计算得出的(CF,DST)。注意:数据源(DS)是存储的实体,而RRA是数据存储的载体。在逻辑上,每个RRA都有所有DS的数据(计算)。RRA和DS的关系如下图所示:

 

 

RRD文件格式分析
RRD文件大体格式如下 

RRD文件格式分析
                数据结构:           typedef struct rrd_t {              stat_head_t      *stat_head;                       ds_def_t         *ds_def;                         rra_def_t        *rra_def;                         live_head_t      *live_head;                             pdp_prep_t       *pdp_prep;                         cdp_prep_t       *cdp_prep;                        rra_ptr_t        *rra_ptr;                        rrd_value_t      *rrd_value;                   } rrd_t;         下面分别详细介绍RRD头部区域和RRD数据区域:         1.RRD头区域:         a)        RRD头区域包括:                                                i.              静态头部:         数据结构:                                          typedef struct stat_head_t {                                         char             cookie[4];    //RRD                                         char             version[5];    //RRD版本信息                                        double           float_cookie;  //                                        unsigned long    ds_cnt;        //DS)数据源的个数                                        unsigned long    rra_cnt;        //RRA个数                                        unsigned long    pdp_step;       //数据插入间隔                                        unival           par[10];              } stat_head_t;         说明:         重要的信息要素:         ds_cnt-数据源个数:该数据值是在创建RRD文件的         时候获取到,作用为标识该RRD文件有多少个DS         rra_cntRRA个数:该数据值是在创建RRD文件的时         候获取到,作用为标识该RRD文件有多少RRA         pdp_step-间隔时间:期望多长时间接受到数据。         该数据值是在创建RRD文件的时候获取到。         举例:         RRD文件命令如下所示:         Rrdtool create first.rrd –start N --step 1  \         DS:fir:COUNTER:2:U:U  \         DS:sec:GAUGE:2:U:U \         RRA:AVERAGE:0.5:1:60 \         RRA:MAX:0.5:60:60 \         RRA:MIN:0.5:3600:24 \         RRA:LAST:0.5: 86400:7 \        命令说明:        命令的格式请参考相关的RRD文档,这里我们只针对        相关上面的数据结构进行解释         ds_cnt    2         rra_cnt    4         pdp_step  1                                               ii.              DS定义域:         数据结构:         typedef struct ds_def_t {       char    ds_nam[DS_NAM_SIZE];  //数据源名称             char    dst[DST_SIZE];          //数据源类型             unival   par[10];                         } ds_def_t;         说明:         ds_nam:数据原名称。在创建的时候指定。         dst:数据源类型。创建时指定。         ds_def [0].ds_nam = fir         ds_def [0].dst    = COUNTER         ds_def [1].ds_nam = sec         ds_def [1].dst    = GAUGE                                              iii.              RRA定义域:         数据结构:         typedef struct rra_def_t          {             char          cf_nam[CF_NAM_SIZE];  //CF(合并类型)             unsigned long  row_cnt;                //RRA行数             unsigned long  pdp_cnt;                //pdp个数             unival        par[MAX_RRA_PAR_EN];                     } rra_def_t;         说明:         cf_nam:合并数据的类型。(PDP数据合成CDP数据时的         类型)         例如:RRA1.         Rrdtool create first.rrd –start N --step 1  \         DS:fir:COUNTER:2:U:U  \         DS:sec:GAUGE:2:U:U \         RRA:AVERAGE:0.5:1:60 \         RRA:MAX:0.5:60:60 \         RRA:MIN:0.5:3600:24 \         RRA:LAST:0.5: 86400:7 \                                     60个,间隔时间为1s的数据(PDP)合成,计算其60个中最大的作为该RRA中的数据源DS)的计算值进行存储。                                            row_cntRRA的行数(每一行有所有数据源的数据)                                            pdp_cnt:RRA在合并数据时所占用的pdp数量。            rra_def_t [0]. cf_nam = AVERAGE            rra_def_t [0]. row_cnt = 60            rra_def_t [0]. pdp_cnt = 1            rra_def_t [1]. cf_nam = AVERAGE            rra_def_t [1]. row_cnt = 60            rra_def_t [1]. pdp_cnt = 60            rra_def_t [2]. cf_nam = AVERAGE            rra_def_t [2]. row_cnt = 24            rra_def_t [2]. pdp_cnt = 60*60            rra_def_t [3]. cf_nam = AVERAGE            rra_def_t [3]. row_cnt = 7            rra_def_t [3]. pdp_cnt = 60*60*24
    小节:       根据上面的分析,到现在应该清楚了RRD文件中RRADS的具体关系了。       具体如下:RRD文件格式分析活动头部:
数据结构:
typedef struct live_head_t {
    time_t           last_up;  //最后更新时间(秒)
    long            last_up_usec;     //最后更新毫秒
} live_head_t;
说明:
last_up : RRD文件最后更新的时间(秒级)
last_up_usec:RRD文件最后更新时间(微秒级)
*仅一条数据
                                     ii.              PDP数据域:
数据结构:
typedef struct pdp_prep_t{    
    char last_ds[LAST_DS_LEN];  //目前更新rrd 文件的数据
    unival        scratch[10];    
} pdp_prep_t; 
说明:
    unival        scratch[10]:该变量类型是一个结构体,变量的功能就是存储计算CDP,计算多长时间没有接受到数据,等相关的信息.在实际的rrd文件中PDP的数量为DS的数量.存储的是每个DS的相关数据信息(时间,真实数据).
                                    iii.              CDP数据域:
typedef struct cdp_prep_t{
    unival         scratch[MAX_CDP_PAR_EN];          
} cdp_prep_t;
说明: 
scratch:该变量存储了与计算CDP相关的数据,如多少个PDP没有数据(与该RRA中PDP的数量有关),目前CDP数据的计算值等信息.
改CDP的数量与RRA的数量相同,同时每一条CDP数据里面包含所有的DS.简单的说就是CDP是RRA的缩小集合,目的是为计算相同RRA中下一条RRA记录做准备.
                                   iv.              RRA指针域:
typedef struct rra_ptr_t {
    unsigned long    cur_row; //目前不同RRA数据已经更新到的
//位置
} rra_ptr_t;
小节:
       到目前位置已经清楚的看到了RRD头文件的大体面貌,至于具体的结构体内部请参考相应的代码.
       RRD头文件结构图如下(根据上面创建命令绘制)







1.RRD数据区:
数据结构: 
typedef    double   rrd_value_t;  //RRD数据类型
rrd_value_t      *rrd_value;            //RRD在内存中存储形式
说明:RRD文件文件中除了RRD文件头部区域剩下的就是RRD文件数据区域.数据区域可以想象成为n*k*m 的矩阵,n为RRA的数量,k为不同RRA的行数,m为数据源DS的数量.
RRD数据区域的图形请参考上面RRA与DS的小节.
0 0