Ambari-Metrics配置指南

来源:互联网 发布:淘宝如何好评截图 编辑:程序博客网 时间:2024/06/07 17:22

Ambari-Metrics配置指南

1.常规配置项

属性

默认值

说明

timeline.metrics.service.operation.mode

(timelineServer里面存储实际Metric数据hbase的模式,默认为embedded,即hbase数据存储在本地文件系统中)

embedded

改成distributed则为分布模式,同时要修改ams-hbase-site中的hbase.cluster.distributed=true配置项

phoenix.spool.directory

(该目录存储发送失败或者重启后未存储到hbase的metric数据)

/tmp

程序会监控该文件夹。当出现新文件时会读取该文件并获取数据.

phoenix.query.maxGlobalMemoryPercentage

25

通过phoenix进行表查询时所能使用的总体内存占比。

timeline.metrics.hbase.compression.scheme

SNAPPY

metric存入到hbase中的压缩方式,默认为SNAPPY该项只能在建表之前改变,即一开始进行配置

timeline.metrics.hbase.data.block.encoding:blockEncoding

FASTDIFF

将重复的row/family/qualifier/进行压缩的方式,减少block的空间占用

timeline.metrics.service.cluster.aggregator.appIds

(那些具有聚集主机级别的metric的应用程序列表,用“,”分隔,比如mem_free的app_id一般都为HOST,但是设置了此项之后,比如增加了datanode,那么则会在集群级别的统计中,统计app_id=datanode的mem_free.

例:datanode,nodemanager,hbase

例如统计datanode所消耗的bytes_read,mem_free

timeline.metrics.service.default.result.limit

(默认是限制取一天的metrics)

5760

metrics结果集最大返回行数,这个是这样计算的,假设每分钟4个metric,一个小时就是240,一天就是5760条。

timeline.metrics.service.resultset.fetchSize

2000

通过jdbc进行聚集查询的结果集本地大小

timeline.metrics.service.checkpointDelay

60

第一次进行checkpoint或者当checkpoint太旧的时候,推迟进行checkpoint的时间

timeline.metrics.host.aggregate.splitpoints

…….

主机级别聚集表的预分区的分隔点设置

timeline.metrics.cluster.aggregate.splitpoints

……

集群级别聚集表的预分区的分隔点设置

timeline.metrics.sink.report.interval

(monitor向timeline发送metric的间隔时间)

60

在hadoop-metrics2.property里面表现为:*.sink.timeline.sendInterval=60000,在monitor的配置目录中体现为:send_interval = 60

timeline.metrics.sink.collection.period

hadoop-sink采集hadoop的metric的间隔时间,即同一个hadoop-metric采集的时间间隔

60

在hadoop-metrics2.property里面表现为:*.sink.timeline.period=60以及*.period=60,修改此值后两个项同步修改

2. 主机级别的聚集统计(以host为单位)相关配置

2.1 实际存储Metrics——表: METRIC_RECORD

此表是实际存储Metrics数据的表,其配置不具备Interval的相关配置项,因为其接收Monitor和HadoopSink发送过来的实际数据,其时间间隔依据Monitor和Hadoop Sink的采集发送Metrics的间隔时间,在配置项中仅有其清理时间。

timeline.metrics.host.aggregator.ttl

(metric_record表是存储实际metrics数据的表)

86400

metric_record表的清理时间,默认为1天

2.2 分钟级对应——表:METRIC_RECORD_MINUTE

属性

默认值

说明

timeline.metrics.host.aggregator.minute.disabled

False

是否不开启此聚集统计 

timeline.metrics.host.aggregator.minute.interval

120

聚集统计时间

timeline.metrics.host.aggregator.minute.ttl

604800

表数据清理时间

timeline.metrics.host.aggregator.minute.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

2.3 小时级对应——表:METRIC_RECORD_HOURLY

属性

默认值

说明

timeline.metrics.host.aggregator.hourly.disabled

False

是否不开启此聚集统计

timeline.metrics.host.aggregator. hourly .interval

3600

聚集统计时间

timeline.metrics.host.aggregator. hourly .ttl

2592000

表数据清理时间

timeline.metrics.host.aggregator.hourly.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

2.4 天级对应——表:METRIC_RECORD_DAILY

属性

默认值

说明

timeline.metrics.host.aggregator.daily.disabled

False

是否不开启此聚集统计

timeline.metrics.host.aggregator. daily .interval

86400

聚集统计时间

timeline.metrics.host.aggregator. daily .ttl

31536000

表数据清理时间

timeline.metrics.host.aggregator.daily.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

3. 集群级别的聚集统计(以MetricName为单位)相关配置

3.1 分钟级对应——表:METRIC_AGGREGATE_MINUTE

属性

默认值

说明

timeline.metrics.cluster.aggregator.minute.disabled

False

是否不开启此聚集统计

timeline.metrics.cluster.aggregator.minute.interval

120

聚集统计时间

timeline.metrics.cluster.aggregator.minute.ttl

2592000

表数据清理时间

timeline.metrics.cluster.aggregator.minute.timeslice.interval

(实则是METRIC_AGGREGATE的间隔时间)

30

Lowest resolution of desired data for cluster level minute aggregates

timeline.metrics.cluster.aggregator.minute.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

3.2 小时级对应——表:METRIC_AGGREGATE_HOURLY     

属性

默认值

说明

timeline.metrics.cluster.aggregator.minute.disabled

False

是否不开启此聚集统计

timeline.metrics.cluster.aggregator.minute.interval

3600

聚集统计时间

timeline.metrics.cluster.aggregator.minute.ttl

31536000

表数据清理时间

timeline.metrics.cluster.aggregator.minute.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

3.3 天级对应——表:METRIC_AGGREGATE_DAILY

属性

默认值

说明

timeline.metrics.cluster.aggregator.daily.disabled

False

是否不开启此聚集统计

timeline.metrics.cluster.aggregator. daily.interval

86400

聚集统计时间

timeline.metrics.cluster.aggregator.daily.ttl

63072000

表数据清理时间

timeline.metrics.cluster.aggregator.daily.checkpointCutOffMultiplier(由来:聚集线程存储了上一次进行聚集的时间点(checkpoint),以后每次决定聚集时,先要满足这样的条件,即(currentTime - lastRunTime) < multipler * aggregation_interval)

2

此值*interval=最大延迟值,即如果聚集的最近一次checkpoint的间隔时间超过最大延迟值,则这个checkpoint会被视为无效。

timeline.metrics.aggregator.checkpoint.dir

/var/lib/

存储聚集checkpoint的目录

0 0