flume监控分析
来源:互联网 发布:sql注入站点 编辑:程序博客网 时间:2024/05/01 12:15
flume 监控分析
由启动flume时可以发现,flume 入口函数位于flume-ng-node目录中的Application.java文件中:
Info: Sourcing environment configuration script /home/bjtianye1/apache-flume-1.7.0-bin/conf/flume-env.sh
Info: Including Hadoop libraries found via (/home/hadoop/hadoop//bin/hadoop) for HDFS access
Info: Including HBASE libraries found via (/home/hbase/hbase/bin/hbase) for HBASE access
Info: Including Hive libraries found via () for Hive access
+ exec /home/jdk//bin/java -Xmx20m -Dflume.root.logger=DEBUG,console,LOGFILE -Xms100m -Xmx2000m -Dflume.monitoring.type=ganglia -Dflume.monitoring.hosts=10.172.152.66:8666 -DisGanglia3=true -cp '/home/bjtianye1/apache-flume-1.7.0-bin/conf:/home/hadoop/hadoop-2.5.2/lib/native org.apache.flume.node.Application -f conf/flume.conf -n agent1
根据命令中含有no-reload-conf(默认为动态加载)参数,决定采用那种加载配置文件方式:一、没有此参数,会动态加载配置文件,默认每30秒加载一次配置文件,因此可以动态修改配置文件;二、有此参数,则只在启动时加载一次配置文件。实现动态加载功能采用了发布订阅模式,使用guava中的EventBus实现。
main方法首先解析各个传入的参数,然后调用handleConfigurationEvent方法,在该方法中调用startAllComponents方法,在该方法中调用loadMonitoring方法加载监控的一些信息,并开始监控服务monitorServer.start()(monitorServer实现了接口MonitorService,该接口中只有两个方法start和stop)
private void loadMonitoring() {
...
monitorServer.configure(context);来加载监控服务的配置信息;
monitorServer.start();启动监控服务
...
}
查看该start 方法的具体实现:
monitorServer有两种,GangliaServer和HTTPMetricsServer,都实现了MonitorService接口。
/**
* Start this server, causing it to poll JMX at the configured frequency.
*/
@Override
public void start() {
try {
socket = new DatagramSocket();
hostname = InetAddress.getLocalHost().getHostName();
} catch (SocketException ex) {
logger.error("Could not create socket for metrics collection.");
throw new FlumeException(
"Could not create socket for metrics collection.", ex);
} catch (Exception ex2) {
logger.warn("Unknown error occured", ex2);
}
for (HostInfo host : hosts) {
addresses.add(new InetSocketAddress(
host.getHostName(), host.getPortNumber()));
}
collectorRunnable.server = this;
if (service.isShutdown() || service.isTerminated()) {
/*
* 创建一个单线程执行程序,它可安排在给定延迟后运行命令或者定期地执行。
* (注意,如果因为在关闭前的执行期间出现失败而终止了此单个线程,那么如果需要,
* 一个新线程会代替它执行后续的任务)。可保证顺序地执行各个任务,并且在任意给定
* 的时间不会有多个线程是活动的。与其他等效的 newScheduledThreadPool(1) 不同,
* 可保证无需重新配置此方法所返回的执行程序即可使用其他的线程
*
*/
service = Executors.newSingleThreadScheduledExecutor();
}
/* scheduleWithFixedDelay(Runnable command, 要执行的任务
* long initialDelay, 首次执行的延迟时间
* long delay, 一次执行终止和下一次执行开始之间的延迟
* TimeUnit unit) initialDelay 和 delay 参数的时间单位
* 创建并执行一个在给定初始延迟后首次启用的定期操作,随后,在每一次执行终止和下一次
* 执行开始之间都存在给定的延迟。如果任务的任一执行遇到异常,就会取消后续执行。否则,
* 只能通过执行程序的取消或终止方法来终止该任务。
*/
service.scheduleWithFixedDelay(collectorRunnable, 0,
pollFrequency, TimeUnit.SECONDS);
}
start()方法中会调用collectorRunnable(一个实现了Runnable的类GangliaCollector )
/**GangliaServer.java
* Worker which polls JMX for all mbeans with
* {@link javax.management.ObjectName} within the flume namespace:
* org.apache.flume. All attributes of such beans are sent to the all hosts
* specified by the server that owns it's instance.
* 这些bean的所有属性都发送到拥有它的实例的服务器指定的所有主机
*/
protected class GangliaCollector implements Runnable {
private GangliaServer server;
@Override
public void run() {
try {
Map<String, Map<String, String>> metricsMap =
JMXPollUtil.getAllMBeans(); //具体的监控数据从这获得,通过JMX方式得到
for (String component : metricsMap.keySet()) {
Map<String, String> attributeMap = metricsMap.get(component);
for (String attribute : attributeMap.keySet()) {
if (isGanglia3) {
server.createGangliaMessage(GANGLIA_CONTEXT + component + "."
+ attribute,
attributeMap.get(attribute));
} else {
server.createGangliaMessage31(GANGLIA_CONTEXT + component + "."
+ attribute,
attributeMap.get(attribute));
}
server.sendToGangliaNodes(); //发送metrics数据到ganglia节点
}
}
} catch (Throwable t) {
logger.error("Unexpected error", t);
}
}
}
监控数据主要是通过类JMXPollUtil的getAllMBean方法中获取的,这个类是flume监控的核心代码,通过Java JMX(java管理扩展,是Java平台上为应用程序、设备、系统等植入管理功能的框架)实现。首先会从MBeanServer服务器获取已注册的 MBean 对象名及其类名,然后将对应的component和属性信息放入Map对象中返回:
public class JMXPollUtil {
private static Logger LOG = LoggerFactory.getLogger(JMXPollUtil.class);
private static MBeanServer mbeanServer = ManagementFactory.getPlatformMBeanServer();
/*
* getAllMBeans()获取所有组件注册的MBean构成的Map<String,Map<String,String>> mbeanMap
* 将组件信息和对应的监控项信息put至集合mbeanMap中并返回
*/
public static Map<String, Map<String, String>> getAllMBeans() {
//newHashMap方法内部只是创建了一个空的HashMap<K,V>实例
Map<String, Map<String, String>> mbeanMap = Maps.newHashMap();
Set<ObjectInstance> queryMBeans = null;
try {
/* queryMBeans获取该MBean服务器所控制的MBean
* name - 对象名模式,标识要检索的 MBean。如果为 null 或未指定域和键属性,则检索所有已注册的 MBean。
* query - 应用到所选 MBean 的查询表达式。如果为 null,则不对所选的 MBean 应用查询表达式
*/
queryMBeans = mbeanServer.queryMBeans(null, null);
} catch (Exception ex) {
LOG.error("Could not get Mbeans for monitoring", ex);
Throwables.propagate(ex);
}
/* 类ObjectInstance用于表示 MBean 对象名及其类名
* getObjectName()方法用于返回对象名部分,类型为ObjectName
*/
for (ObjectInstance obj : queryMBeans) {
try { //ObjectName类中有重写toString方法
if (!obj.getObjectName().toString().startsWith("org.apache.flume")) {
continue;
}
//getMBeanInfo方法发现了 MBean 为管理而公开的属性和操作
//getAttributes返回为了便于管理而公开的属性的列表。
MBeanAttributeInfo[] attrs = mbeanServer.getMBeanInfo(obj.getObjectName()).getAttributes();
String[] strAtts = new String[attrs.length];
for (int i = 0; i < strAtts.length; i++) {
strAtts[i] = attrs[i].getName();
}
//mbeanServer.getAttributes获得指定 MBean 的多个属性值
AttributeList attrList = mbeanServer.getAttributes(obj.getObjectName(), strAtts);
//获取组件名
String component = obj.getObjectName().toString().substring(
obj.getObjectName().toString().indexOf('=') + 1);
//创建存储属性键值对的HashMap集合
Map<String, String> attrMap = Maps.newHashMap();
for (Object attr : attrList) {
Attribute localAttr = (Attribute) attr;
if (localAttr.getName().equalsIgnoreCase("type")) {
component = localAttr.getValue() + "." + component;
}
attrMap.put(localAttr.getName(), localAttr.getValue().toString());
}
mbeanMap.put(component, attrMap);
} catch (Exception e) {
LOG.error("Unable to poll JMX for metrics.", e);
}
}
return mbeanMap;
}
}
Sink组件
各个具体监控组件的私有指标信息都是在各个组件自己实现定义,这些源码都是在flume-ng-core中的org.apache.flume.instrumentation包下面,所有的监控组件都会继承MonitoredCounterGroup实现xxxCounterMBean接口,MonitoredCounterGroup中定义了一些基本公有的监控属性(启动时间、停止时间等),提供了注册至MBeanServer的方法registerMBean,在具体的组件调用时会进行注册,xxxCounterMBean 则定义了获取监控元素的方法接口,具体实现还是在监控组件中实现。这里就拿 Sink组件来大致看下。
SinkCounter 类继承 MonitoredCounterGroup抽象类,并实现了 SinkCounterMBean 接口:
public class SinkCounter extends MonitoredCounterGroup implements
SinkCounterMBean {
private static final String COUNTER_EVENT_DRAIN_ATTEMPT =
"sink.event.drain.attempt";
private static final String COUNTER_EVENT_DRAIN_SUCCESS =
"sink.event.drain.sucess";
private static final String[] ATTRIBUTES = { //组件的监控指标属性信息
COUNTER_CONNECTION_CREATED, COUNTER_CONNECTION_CLOSED,
COUNTER_CONNECTION_FAILED, COUNTER_BATCH_EMPTY,
COUNTER_BATCH_UNDERFLOW, COUNTER_BATCH_COMPLETE,
COUNTER_EVENT_DRAIN_ATTEMPT, COUNTER_EVENT_DRAIN_SUCCESS
};
@Override
public long getConnectionCreatedCount() { //具体指标的获取方法
return get(COUNTER_CONNECTION_CREATED);
}
......
SinkCounterMBean接口主要就是声明了一个属性的获取方法:
public interface SinkCounterMBean {
long getConnectionCreatedCount();
......
long getEventDrainSuccessCount();
long getStartTime();
long getStopTime();
}
上边这就是flume监控的一个大致框架,你可能会发现上边的类或者接口的名字都有点相似,其实这不是偶然的,它是 JMX 中的统一规范。
- flume监控分析
- flume监控
- flume 监控
- flume监控
- Flume 监控
- flume监控
- 【Flume】【源码分析】flume中http监控类型的源码分析,度量信息分析,以及flume的事件总线
- Flume-NG内置计数器(监控)源码级分析
- Flume-NG内置计数器(监控)源码级分析
- flume源码分析三:flume组件的启动,关闭和监控
- flume监控指标详解
- Flume-ng 监控介绍
- Flume之监控
- Flume之监控
- 规划、部署、监控Flume
- socket之flume监控系统
- Flume几种监控方式
- Flume 监控目录文件 spooldir
- Oracle 自定义split 函数
- oc数组问题小思考
- Android Error(while compiling): PRAGMA journal_mode
- cocos2dx 跨平台iOS 求助
- 多线程之间的通信
- flume监控分析
- 如何清除浮动元素所带来的影响?
- Android启动远程服务
- Android中的属性动画
- linux日常--添加用户、分组、文件夹权限
- jvm的内存如何分配使用?
- UIWebView 的 webViewDidFinishLoad not called ??
- mysql 省市县镇(乡)四级地区数据库
- 印象笔记(可本地使用)