hadoop用虚拟机做为datanode

来源:互联网 发布:伪随机关注算法 编辑:程序博客网 时间:2024/06/03 20:52

测试:

select count(1) from user;

1.9亿条数据

 

1、 1台namenode+8台datanode,耗时54秒

2、将其中的一台datanode装三个虚拟机,改为:1台namenode+8台实际的datanode+3台虚拟机的datanode,耗时96秒

 

多台虚拟机作为多个datanode节点并不能改善数据处理性能,反而会造成数据倾斜,性能更差