2.3 Configurable接口

来源:互联网 发布:菠菜源码 编辑:程序博客网 时间:2024/04/27 13:41

2.3 Configurable接口

Configurable是一个很简单的接口,也位于org.apache.hadoop.conf包中,其类图如图2-3所示。

从字面理解,Configurable的含义是可配置的,如果一个类实现了Configurable接口,意味着这个类是可配置的。也就是说,可以通过为这个类的对象传入一个Configuration实例,提供对象工作需要的一些配置信息。Hadoop的代码中有大量的类实现了Configurable接口,如org.apache.hadoop.mapred.SequenceFileInputFilter.RegexFilter。RegexFilter对象工作时,需要提供一个正则表达式,用于过滤读取的记录。由于RegexFilter的父类Filter中实现的Configurable接口,RegexFilter可以在它的setConf()方法中,使用Configuration.get()方法获取以字符串传入的正则表达式,并初始化成员变量p。相关代码如下:

  1. public void setConf(Configuration conf) {  
  2.   //在conf中获取键为"sequencefile.filter.regex"(FILTER_REGEX)的配置项  
  3.   String regex = conf.get(FILTER_REGEX);  
  4.  
  5.   if (regex==null)  
  6.      throw new RuntimeException(FILTER_REGEX + "not set");  
  7.   this.p = Pattern.compile(regex);  
  8.   this.conf = conf;  
  9. }  

Configurable.setConf()方法何时被调用呢?一般来说,对象创建以后,就应该使用setConf()方法,为对象提供进一步的初始化工作。为了简化对象创建和调用setConf()方法这两个连续的步骤,org.apache.hadoop.util.ReflectionUtils中提供了静态方法newInstance(),代码如下:

  1. public static <T> T newInstance(Class<T>theClass, Configuration conf) 

方法newInstance()利用Java反射机制,根据对象类型信息(参数theClass),创建一个新的相应类型的对象,然后调用ReflectionUtils中的另一个静态方法setConf()配置对象,代码如下:

  1. public static void setConf(Object theObject, Configuration conf) {  
  2.   if(conf != null) {  
  3.      //传入的对象实现了Configurable接口  
  4.      if(theObject instanceof Configurable) {  
  5.         //调用对象的setConf方法,传入Configuration对象  
  6.         ((Configurable) theObject).setConf(conf);  
  7.      }  
  8.      setJobConf(theObject, conf);  
  9.   }  

在setConf()中,如果对象实现了Configurable接口,那么对象的setConf()方法会被调用,并根据Configuration类的实例conf进一步初始化对象。


原创粉丝点击