Storm常见模式——BasicBolt

来源:互联网 发布:网络物理隔离卡 编辑:程序博客网 时间:2024/05/17 08:42

Storm中的很多Bolt都有一个最常见的处理步骤:

  1. 读入一个tuple;
  2. 根据这个输入tuple,提取后发射0个,1个或多个tuple;
  3. 最后,通过ack操作确认这个tuple被成功处理。

按照上述处理步骤,依次处理发向这个Bolt的各个tuple元组。

这种模式可以实现像ETL这类的简单函数或过滤器功能,Storm中专门为这种模式封装了相应接口:IBasicBolt。BaseBasicBolt等类实现了这一接口。

下面是以BaseBasicBolt为基础,按照上述模式实现词频统计的Bolt(代码参考链接:storm-starter):

复制代码
public static class WordCount extends BaseBasicBolt {     //记录每个单词及单词出现的次数        Map<String, Integer> counts = new HashMap<String, Integer>();        @Override        public void execute(Tuple tuple, BasicOutputCollector collector) {            String word = tuple.getString(0);            Integer count = counts.get(word); //提取单词出现次数            if(count==null)         count = 0;            count++;            counts.put(word, count); //更新单词出现次数            collector.emit(new Values(word, count)); //发射统计结果        }        @Override        public void declareOutputFields(OutputFieldsDeclarer declarer) {       declarer.declare(new Fields("word", "count"));        }    }
原创粉丝点击