RRDTool中文手册

来源:互联网 发布:网络教育秋季报名时间 编辑:程序博客网 时间:2024/05/17 23:23

RRDTool 中文手册

转自http://blog.chinaunix.net/u/12909/showart_2131009.html

rrdtool  学习结构图

http://www.hiadmin.com/wp-content/uploads/2008/08/rrdtool.png

一、简介

    RRDtool是由Tobias Oetiker 编写并由全球各地的许多人贡献的工具。本篇文档的作者是Alex van den Bogaerdt 主要是帮助你理解RRDtool是什么,它能够帮助你作些什么。 RRDtool的文档对于有些人来说过于技术化。本教程帮助你理解RRDtool的基本概念。它为你自学RRDtool的文档做好准备。本文档还重点介绍了网络统计方面的知识。


1、RRDtool是什么东西?

    RRDtool是指Round Robin Database 工具(环状数据库)。Round robin是一种处理定量数据、以及当前元素指针的技术。想象一个周边标有点的圆环--这些点就是时间存储的位置。从圆心画一条到圆周的某个点的箭头--这就是指针。就像我们在一个圆环上一样,没有起点和终点,你可以一直往下走下去。过来一段时间,所有可用的位置都会被用过,该循环过程会自动重用原来的位置。这样,数据集不会增大,并且不需要维护。RRDtool处理RRD数据库。它用向RRD数据库存储数据、从RRD数据库中提取数据。


2、RRD中可以存放什么样的数据?

    可以适合时间序列的数据。就是说你必须能够在时间的几个点上度量某些值,并提供这些信息给RRDtool。如果你能够做到这一点,RRDtool就能够存储它们。这些数值必须是数字,但是不一定要是整数,在与MRTG合用时。(下一节会给出更详细的介绍)。
    下面的例子是关于SNMP的,SNMP是简单网络过来协议的缩写。简单是指协议简单--并不表示管理或监视网络简单。读完本篇文档后,你应当能够对人们谈论的SNMP的东西有更多的理解。现在,只要知道SNMP可以用来查询设备中保持的计数器的值就可以了。我们要存放到RRD数据库中的正是这些计数器中的数值。


3、RRDtool可以用来干什么?

    RRDtool源自MRTG(多路由器流量绘图器)。MRTG是有一个大学连接到互联网链路的使用率的小脚本开始的。MRTG后来被当作绘制其他数据源的工具使用,包括温度、速度、电压、输出量等等。
    很可能你会从使用RRDtool来存储和处理通过SNMP收集到的数据开始。这些数据很可能是某个网络或计算机接收或发送的字节数(比特数)。它也可以用来显示潮水的波浪、阳光射线、电力消耗、展会的参观人员、机场附近的噪音等级、你喜欢的度假区的温度、电冰箱的温度、以及任何你可以想象的东西。
    你最需要一个度量数据,以及能够提供这些数据给RRDtool的感应器就可以了。RRDtool会让你创建数据库、存储数据、提取数据、创建用于在Web浏览器中显示的PNG格式的图像。这些PNG图像以来于你收集的数据,它可以是网络平均使用率、峰值。


二、学习实例
1、第一个RRD数据库

    在我看来,学习某个东西的最好办法就是实践。为什么现在不开始呢?我们会创建一个数据库,放一些数值到它里面,然后提取这些数据。你的输出应当与本文档中的输出是一样的。
    我们会从一些简单的入手,然后把汽车与路由器比较,或者将公里和比特、字节数比较。他们都是一样的:都是某些时段的某些数值。
    假设我们有一个向互联网发送数据和接收数据的设备。该设备保留一个计数器,该计数器在开启设备时设置为0,并在每传送一个字节就加1。该计数器可能会有一个最大值。如果该值达到最大时,在加一个字节的计数,该计数器就会再次从0开始。这与世界上的许多计数器都是一样的,比如车辆上的里程计数器。
    关于网络的讨论通常用每秒比特数来衡量,因此我们要习惯这种用法。把一个字节看成是8个比特,并且开始用比特而不是字节来思考问题。不过,计数器仍然用字节数为单位来计量!在SNMP世界里,大部分的计数器都是32比特的。这就意味着他们计数范围是0-4294967。我们在例子里会用到这些数值。该设备在被查询时,会返回计数器的当前值。我们知道从上次查询设备开始到现在的时间,因此我们现在就知道每秒 平均传输了多少字节数。这不难计算。首先用文字来描述,然后计算:

用当前查询到的计数器值,减去上一次查询的计数器值,把当前查询时间和上次查询时间作上述同样操作(秒)将(1)的结果除以(2)的结果,得到的结果就是每秒的字节数。乘以8就得到每秒的比特数(bps)

  • 实例一

     

      你现在正在开车。12:05时你看了一下仪表盘上的里程计数器,它显示这俩车已经行驶了12345公里。12:10分时,你有看了一下里程计数器,它显示 12357公里。这表示你在5分钟内行驶了12公里。科技人员会把它转换成米/秒,这样可以更好的进行比较(每5分钟的字节数)和(每秒比特数)。
      我们行驶了12公里,也就是12000米。我们在5分钟内,或者说是300秒内完成。我们的速度是1200米/300秒,或者说是40米/秒。
      我们可以用公里/小时来计算速度:12乘以5分钟就是一个小时,因此我们必须把12公里乘以12得到144公里/小时。对于和我一样说英语的朋友来说,就是90英里/小时,因此不要在家里或我生活的地方尝试这个速度 :)
      记住:这些数值都仅仅是平均值。如果无法从数字中得到你是否以固定的速度在行驶。本教程后面有一个例子说明这个问题。我希望你理解在计算米/秒或者比特/秒。唯一的差别在于收集数据的方式。即使是K这个单位也是一样的,因为在网络术语中,K同样表示1000。
      我们现在要创建一个数据库,在此数据库中我们能够保存所有这些有趣的数字。启动这个程序的方法可能在各个操作系统上各不相同,但是我假设你可以搞清楚它是否与你的操作系统不同,键入下面的行作为一个长长的行(为了可读性,我得把他分成几行)并且用 / 来分割。
    rrdtool create test.rrd /
    --start 920804400 /
    DS:speed:COUNTER:600:U:U /
    RRA:AVERAGE:0.5:1:24 /
    RRA:AVERAGE:0.5:6:10


    2、创建了什么东西?

    • 我们创建的rrd数据库名为test (test.rrd),它的起始时间是我写这篇文档的当天下午,也就是1999年3月7日(该日期转换成920804400秒)。我们的数据库存放一个名为 ’speed’ 的数据源(DS),它表示一个计数器。该计数器每5分钟(缺省)读取一次。在同一个数据库中,保存有2个环状归档(RRA),一个是每次读取时的平均数据(例如:没有东西进行平均)并保留24个样本(24乘以5分钟是2小时)。另一个RRA有6个平均值(半小时)并包含10个这样的平均值(例如5个小时)
               (LINUX把标准时间转成时间戳   date -d "`date`" +"%s"
                       把时间戳转成标准时间   date -d '1970-01-01 1163862985 sec utc'
            • RRDtool用UNIX世界的特殊时间戳。该时间戳是自1979年1月1 UTC时间开始到当前逝去的秒数。该时间戳的值被转换成本地时间,不同时区不一样。
              例子中,我所说的时间当中,小时可能对你来说是错误的。这对这些例子中的结果有一点影响,在阅读时,只需要修正时间中的小时即可。例如:我看到 12:05 的话,在英国的家伙看到的时间就是 11:05 。

            现在我们得向数据库中填入一些数字:
            12:05 12345 KM
            12:10 12357 KM
            12:15 12363 KM
            12:20 12363 KM
            12:25 12363 KM
            12:30 12373 KM
            12:35 12383 KM
            12:40 12393 KM
            12:45 12399 KM
            12:50 12405 KM
            12:55 12411 KM
            13:00 12415 KM
            13:05 12420 KM
            13:10 12422 KM
            13:15 12423 KM

             

          • 我们用下面的命令把上述数据填入数据库:

             

            rrdtool update test.rrd 920804700:12345 920805000:12357 920805300:12363
            rrdtool update test.rrd 920805600:12363 920805900:12363 920806200:12373
            rrdtool update test.rrd 920806500:12383 920806800:12393 920807100:12399
            rrdtool update test.rrd 920807400:12405 920807700:12411 920808000:12415
            rrdtool update test.rrd 920808300:12420 920808600:12422 920808900:12423

            可在一个命令向数据库填入多值。为了可读性,我只用三个,实际最大数据与OS相关。
            用 rrdtool fetch 命令从数据库中提取数据。

            rrdtool fetch test.rrd AVERAGE --start 920804400 --end 920809200
              该命令会返回如下输出结果:
              speed

              920804700: nan
              920805000: 4.0000000000e-02
              920805300: 2.0000000000e-02
              920805600: 0.0000000000e+00
              920805900: 0.0000000000e+00
              920806200: 3.3333333333e-02
              920806500: 3.3333333333e-02
              920806800: 3.3333333333e-02
              920807100: 2.0000000000e-02
              920807400: 2.0000000000e-02
              920807700: 2.0000000000e-02
              920808000: 1.3333333333e-02
              920808300: 1.6666666667e-02
              920808600: 6.6666666667e-03
              920808900: 3.3333333333e-03
              920809200: nan
              NaN 表示 非数字 。 如果你的OS输出 U 或 UNKN 或者其他类似东西都是正常的。如果其他地方错误,可能是因为你的过程中的那些步骤出错了(当然假设我的教程是完全正确的 :-))。这样的话,删除数据库文件然后再重新尝试。 有时事情就会变化。本例输出的数据是0.04 而不是 4.0000e-02 。这些实际上是一样的数字,只是写法不同而已。如果rrdtool今后的版本显示略有不同是输出也不要大惊小怪。本文对RRDtool 1.2.0版本都是正确的。


            3、绘第一张图
            rrdtool graph speed.png /
            --start 920804400 --end 920808000 /
            DEF:myspeed=test.rrd:speed:AVERAGE /
            LINE2:myspeed#FF0000

             

          • 如图一 
              该命令会创建名为speed.png的图像文件,该图像从12:00开始,到13:00。有一个名为myspeed的变量定义,它使用来自 test.rrd数据库的 speed RRA中的数据。绘制的线条是2像素高,表示myspeed变量。颜色是红色的.
              你会注意到图像的起始不是12:00而是12:05。这是因为在此时间之前的数据不够计算出平均值。这只会在缺少某些样本的情况下发生,不会经常发生。
              颜色是由红、绿、蓝构成的。对每种颜色成分,你可以用16进制来表示使用多少,其中00表示不包含,FF表示完全包含。白色是由红、绿、蓝组成的:FFFFFF。黑色是全部不包含:000000。


            4、用几种数学方法来绘图

              查看图像时,你会注意到横轴下标为 12:10、12:20、12:30、12:40、12:59。有时某些下标不适合(可能是12:00和13:00)会被忽略掉。
              纵轴显示我们输入的范围。下面提供的公里数,以及除以300妙的结果,我们得到非常小的数值。为了更加精确,第一个值是12(12567-12456),除以300后得到0.04,RRDtool显示时为 40m 表示 40/1000 。 其中的 m 与米、公里、或者毫米都没有任何关系!RRDtool不知道我们的数据单位,它只处理没有单位的数据
              如果我们用米来衡量我们的距离,就会是这样:(12′357′000-12′345′000)/300 = 12′000/300 = 40.
              因为许多人都对这样的数值范围感觉更好,修正一下,创建数据库,并存储数据。但更好的办法:在创建png文件时进行一些计算!
            rrdtool graph speed2.png /
            --start 920804400 --end 920808000 /
            --vertical-label m/s /
            DEF:myspeed=test.rrd:speed:AVERAGE /
            CDEF:realspeed=myspeed,1000,/* /
            LINE2:realspeed#FF0000

             

          • 如图二



            注意:不要忘记操作符 * 后/,它用来将*从OS可能解释的符号转义,而不是直接传递给rrdtool命令。
            在查看PNG:注意到 m 不见了,正确。同样,在图像中加入了一个标注。出了上面提到的几点外,PNG看起来应当是一样的。

              计算是在CDEF部分中指定的,使用逆波兰表达式( RPN )表示的。我们要求RRDtool所作的事情是:`取数据源myspeed, 以及数值1000;把他们相乘` 。在此不要被RPN困扰了,后面介绍。同时,你可能想读CDEF的教程。以及Steve Rader的RPN表达式的教程。不过先看我这篇教程吧。
              如果用1000乘以这些数值,显示把同样的数据显示成公里/小时也是可以的。
              要修改米/秒为单位的值:
              计算米/小时: value * 3′600
              计算公里/小时: value / 1′000
              合起来: value * (3′600/1′000) 或者 value * 3.6

            下面我们来创建这个PNG文件,并加入更多的魔幻功能…

            rrdtool graph speed3.png /
            --start 920804400 --end 920808000 /
            --vertical-label km/h /
            DEF:myspeed=test.rrd:speed:AVERAGE /
            "CDEF:kmh=myspeed,3600,*" /
            CDEF:fast=kmh,100,GT,kmh,0,IF /
            CDEF:good=kmh,100,GT,0,kmh,IF /
            HRULE:100#0000FF:"Maximum allowed" /
            AREA:good#00FF00:"Good speed" /
            AREA:fast#FF0000:"Too fast"

             

          • 如图三



            这个图像看起来更好。速度用KM/H表示,有一个附加的线条表示最大允许的速度(在我行驶的道路上的最大限速)。我还修改了速度的显示颜色,把它从线条改为区块。


            5、一个更复杂的图例

              在限速内的速度衡量方法是:
              检查公里/小时是否大于100 ( kmh,100 ) GT
              如果是,返回0,否则返回公里/小时。 ((( kmh,100 ) GT ), 0, kmh) IF

              对于上述的限速值:
              检查公里/小时是否大于100 ( kmh,100 ) GT
              如果是,返回公里/小时,否则返回0。 ((( kmh,100) GT ), kmh, 0) IF

            我愿意相信RRDtool的绘图功能能够处理的数据没有任何虚拟的限制。我会解释他们是如何工作的,不过看看下面的PNG图像:

            rrdtool graph speed4.png /
            --start 920804400 --end 920808000 /
            --vertical-label km/h /
            DEF:myspeed=test.rrd:speed:AVERAGE /
            "CDEF:kmh=myspeed,3600,*" /
            CDEF:fast=kmh,100,GT,100,0,IF /
            CDEF:over=kmh,100,GT,kmh,100,-,0,IF /
            CDEF:good=kmh,100,GT,0,kmh,IF /
            HRULE:100#0000FF:"Maximum allowed" /
            AREA:good#00FF00:"Good speed" /
            AREA:fast#550000:"Too fast" /
            STACK:over#FF0000:"Over speed"

             

            如图四


             

            三、RRD数据库更新实例

              在简易入门(一)中已经介绍过update 命令:它使用1个或多个参数,其格式为: : . 如果你知道可以用一个 N 表示当前的时间,你一定会高兴的。或者你可以用Perl中的 time 函数来指定时间:
              perl: perl -e ‘print time, “/n” ‘
              shell: date +%s
              如何按照固定间隔运行某个程序各操作系统不同。不过可以用伪码来表示:
              - Get the value and put it in variable “$speed”
              - rrdtool update speed.rrd N:$speed

              每5分钟运行一次上面的脚本。在你想知道图像看起来是啥样时,运行上面的例子。你可以把他们放入一个脚本中。运行此脚本后,查看我们刚才创建的graph。

            四、SNMP相关知识

              我可以想像到只有少数的人能够每5分钟从他们的汽车中读取一次真实的数据。其他人不得不清算其他类型的计数器。你可以测量打印机打印的页数,咖啡机做的咖 啡杯数,计算使用的电流的设备,都可以。递增的计数器可以被监视,并且用你已经学会的方法被绘制成图像。稍后我们就能够监视像温度计这样的值了。
              大多数对RRDtool感兴趣的人会使用一个跟踪网络设备传输数据量的计数器。这样我们下一步就来作这个。我们会从解释如何收集数据开始。

              有些人会说有些工具可以帮助你收集数据。他们是对的!不过,我感觉理解这些工具不是必须的非常重要。在你能够确定为什么事情发生了错误,你要知道他们是如何工作的。

              本例中使用的工具在本文档前面非常简短地提到过,它就是所谓的SNMP。它是与联网设备交谈的方式。

            下面用到的工具名为 snmpget ,以下是关于它是如何工作的说明:

            snmpget device password OID

            snmpget -v[version] -c[password] device OID
              对于device, 你要用设备的名称或者IP地址来替换。对于password, 你需要使用SNMP领域中称为 comunity read string 来替换。对于某些设备来说,缺省的 public 可以工作,但是该设置可能会被关闭,调整或者由于安全和机密的原因而被保护起来。请阅读你的设备或程序的文档。

              接下来有一个称为OID的参数,它用来表示 对象标识符 。

              刚开始学习SNMP时,它看起来有些令人困惑。在你看到MIB管理信息基时,就不会那么困难了。MIB是用来描述数据的倒状树,它有只有一个根结 点,并且由根结点开始有多个分支。这些分支都以另一个结点终结,他们继续向下分支,如此继续。所以的分支都有一个名称,它们构成了一个我们能够沿着往下的 路径。我们所沿着的这些分支都被命名了:iso, org, dod, internet, mgmt 和mib-2.这些名称也可以用数字方式记录,就像 1 3 6 1 2 1。
              iso.org.dod.internet.mgmt.mib-2 (1.3.6.1.2.1)

              有些程序会使用前导点 . , 令人感到许多困惑。在一个OID中并 没有前导点。为了显示OID缩记法和OID完整记法的区别,(通常约定)在使用OID的完整记法时使用前导点。通常这些程序在返回数据给你时,会省略却缺 省的部分。这些程序有的有几个缺省前缀,这会让事情显得更加糟糕。
              Ok, lets continue to the start of our OID: we had 1.3.6.1.2.1 From there, we are especially interested in the branch interfaces which has number 2 (e.g., 1.3.6.1.2.1.2 or 1.3.6.1.2.1.interfaces).

              好了,我们继续OID的初步学习:我们有一个1.3.6.1.2.1的OID,我们对(其下面的) interface 分支特别感兴趣,其编号为2(例如:1.3.6.1.2.1.2 或 1.3.6.1.2.1.interface)。

              首先,我们得要有几个SNMP的程序。先看看你的OS平台上是否有已编译好的软件包。这是最便捷的方式。如果没有,你就得下载源代码、并编译。互联网上到处都是源代码、程序。你可以用你喜欢的任何方式、搜索引擎来找到相关的信息。

              假设你已经有了这些程序。先试着收集大多数系统都有的数据。记住:那些引起我们兴趣的树,它上面的部分都有一个简略名。

              在此我会给出一个在Fedora Core 3操作系统上可用的例子。如果对你的操作系统不可用,请查看snmp的手册,并作相应的调整让它能够运行。

            snmpget -v2c -c public myrouter system.sysDescr.0
              该设备应当回应其自身的描述,该描述可能是一个空的。只有在你从某个设备获得响应后,你才能够继续。其中可能需要使用不同的口令、或者不同的设备。
            snmpget -v2c -c public myrouter interfaces.ifNumber.0

              最好你得到的结果是一个数字。如果这样的话,你就可以继续往下,并试试另一个叫做 snmpwalk 的程序。

            snmpwalk -v2c -c public myrouter interfaces.ifTable.ifEntry.ifDescr
              如果该命令返回一系列的接口,这就对了。以下是该命令运行的返回结果的例子:
            [user@host /home/alex]$ snmpwalk -v2c -c public cisco 2.2.1.2
            interfaces.ifTable.ifEntry.ifDescr.1 = "BRI0: B-Channel 1"
            interfaces.ifTable.ifEntry.ifDescr.2 = "BRI0: B-Channel 2"
            interfaces.ifTable.ifEntry.ifDescr.3 = "BRI0" Hex: 42 52 49 30
            interfaces.ifTable.ifEntry.ifDescr.4 = "Ethernet0"
            interfaces.ifTable.ifEntry.ifDescr.5 = "Loopback0"
              对于cisco设备,我想监视 ‘Ethernet0` 接口,从上面的输出结果能够看到该接口的编号是 4。 我试着运行如下命令:
            [user@host /home/alex]$ snmpget -v2c -c public cisco 2.2.1.10.4 2.2.1.16.4

            interfaces.ifTable.ifEntry.ifInOctets.4 = 2290729126
            interfaces.ifTable.ifEntry.ifOutOctets.4 = 1256486519
              这样,我就有两个OID需要监视,他们是(这次使用完整记法):
              1.3.6.1.2.1.2.2.1.10

              1.3.6.1.2.1.2.2.1.16
              这两个OID都有接口编号4。
              别被糊弄了,我可不是试一次就搞定的。我花了一些数据来搞清这些数字都是什么意思。把这些编号转换成描述文字大有帮助… 至少在大家谈论MIB和OID时,你知道他们是什么东西。别忘了接口编号(如果它不是附属接口,就是0),如果用snmpget没有得到响应,试试 snmpwalk。

            五、应用RRDtool的实例

              实际运用的例子
              开始有趣的东东吧。首先,创建一个新的数据库。它包含输入和输出2个计数器的数据。该数据被放入能够进行平均的归档中。他们一次使用1、6、24、或 288个样本。他们同时被存入保存最大数字的归档中。稍后会解释。样本间隔时间为300秒,也就是5分钟,这是一个好的开始。:

              1个样本 “平均” 保留5分钟的周期
              6个样本 每30分钟进行一次平均
              24个样本 每2小时进行一次平均
              288个样本 每1天进行一次平均

              我们试着与MRTG互相兼容,MRTG存储以下数据::

              600 5分钟样本数: 2天和2小时
              600 30分钟样本数: 12.5天
              600 2小时样本数: 50天
              732 1天样本数: 732天

              这些范围被补充进去,因此在数据库中保存的数据总数大约797天。RRDtool存储不同的数据,它不会在 每日 归档停止的地方开始 每周 归档。对于这两个归档,最新的数据会是在 now 附近,因此我们需要比MRTG保存更多的数据!
              我们需要::

              600个5分钟的样本 (2天和2小时)
              700个30分钟的样本 (2天和2小时,加12.5天)
              775个2小时的样本 (上述+50天)
              797个1天的样本 (上述+732天,环型回绕最大797)

            rrdtool create myrouter.rrd /
            DS:input:COUNTER:600:U:U /
            DS:output:COUNTER:600:U:U /
            RRA:AVERAGE:0.5:1:600 /
            RRA:AVERAGE:0.5:6:700 /
            RRA:AVERAGE:0.5:24:775 /
            RRA:AVERAGE:0.5:288:797 /
            RRA:MAX:0.5:1:600 /
            RRA:MAX:0.5:6:700 /
            RRA:MAX:0.5:24:775 /
            RRA:MAX:0.5:288:797

            接下来要做的就是收集数据并把它保存起来。以下是一个例子。它是用伪码写的,你得根据OS调整后让它能够运行。:

            while not the end of the universe
            do
            get result of
            snmpget router community 2.2.1.10.4
            into variable $in
            get result of
            snmpget router community 2.2.1.16.4
            into variable $out

            rrdtool update myrouter.rrd N:$in:$out

            wait for 5 minutes
            done

            在收集了1天的数据后,试着用下面的命令创建图像::

            rrdtool graph myrouter-day.png --start -86400 /
            DEF:inoctets=myrouter.rrd:input:AVERAGE /
            DEF:outoctets=myrouter.rrd:output:AVERAGE /
            AREA:inoctets#00FF00:"In traffic" /
            LINE1:outoctets#0000FF:"Out traffic"

            这会产生一个具有1天流量值的图像。1天有24(小时)x60(分钟)x60(秒)。我们从当前时间-86400秒开始。我们用DEF把输入和输出字节数定义成myrouter.rrd数据库中的的平均值,并且绘制输入流量区和输出流量线。

          • 原创粉丝点击