hadoop中Partitioner、WritableComparator的自己总结

来源:互联网 发布:淘宝个性主题 编辑:程序博客网 时间:2024/05/18 13:45

在hadoop流程中,涉及到一些merge合并和排序。

当key为bean时,bean需要实现writablecomparator接口。其中的compareTo方法,是提供给reduce的,当强制作为同一个key并进行排序的时候,reduce会调用这个bean的compareTo方法来比较,并进行排序

partitioner则可以用来制定分区。

writableComparator则可以指定哪些bean是一个相同的key。这样,不同的bean,也可以被reduce认为是同一个key

原创粉丝点击