Hadoop In action 笔记

来源:互联网 发布:数据库程序设计难不 编辑:程序博客网 时间:2024/05/17 13:46

第63页

1、将map 方法中新生成类的操作放到方法对应的类中,而不是方法中。

     因为,有多少条记录,Map()方法就会被调用多少次(对于每个JVM而言,就是一个分片中的记录数)。减少map()方法中生成的对象个数,就会提高性能,减少垃圾回收。在Map()中,当新生成的对象被传统给output.collect(),我们依赖于output.collect()的约定不会修改这两个对象。




原创粉丝点击