Hadoop学习心得

来源:互联网 发布:富二代 知乎 编辑:程序博客网 时间:2024/06/07 13:50

1. 伪分布式情况下,当每次启动hadoop发现提示无法访问本机的9000端口,也就是无法访问namenode。暂时解决方案,格式化namenode重启,找到datanode的目录删除version的txt文本,因为格式化namenode后,namenode与datanode的ClusterID不同,删除后重启动自动添加匹配。 推测产生此问题的原因:hadoop路径没有改,默认的路径是系统临时目录,经常被清洗。


2.在eclipse环境下,编译hadoop程序(cleanup)


3.FileInputFormat(job, new Path(args[0]));   args[0]在命令行中传参。


4.运行时,不用先建好输出目录,打上名字自动建立。

原创粉丝点击