Hadoop测试-简单分布式程序运行
来源:互联网 发布:ubuntu默认root密码 编辑:程序博客网 时间:2024/05/17 02:42
1.PI计算
1.1 基本步骤
(1)首先切换到hadoop的安装目录下,可以看到hadoop的安装目录中已经自带了一些小程序,都打包在hadoop-examples-1.2.1.jar中,下一步就是如何打开jar包。
(2)在命令行中,直接键入hadoop,可以显示各种命令用法。
可以看到,其中有个jar,用于运行jar文件。
(3)接下来输入hadoop jar hadoop-examples-1.2.1.jar打开jar包,可以看到各种程序的名字。
(4)再下一步就直接运行某个程序,直接在命令行中输入代码:hadoop jar hadoop-examples-1.2.1.jar pi,此时可以发现系统提示用法,需要参数,参数分别为maps的数量以及每个map的实例数量。
1.2 结果展示
(5)最终输入参数运行程序,可以进入用户界面中查看进度和完成情况,输入主机名+50030端口号,进入Map/Reduce Adminstrator管理界面。
在命令行中可以看到输出结果:
2.WordCount程序
2.1 目录设置
(1)输入hadoop dfs -ls /可以看到hadoop文件系统中的主目录下的内容,可以看到3个文件夹。其实,这边展示的目录是hdfs下的文件目录,其实真实代码是:hadoop dfs -ls hdfs://hadoop-master.dimensoft.com.cn:9000/,之所以可以省略是因为Hadoop的配置文件中已经进行过配置。
(2)在data下新建数据输入目录,数据输入用于存放进行wordcount的文档集,而进行程序之后一般需要一个输出文档,用于统计文档中单词出现的次数,此时键入命令。
2.2 文本创建
其次在Linux系统下,首先是要新建或者获取到需要统计单词数的文档,在这里,我们选择自己新建一个简单文档,然后将需要统计单词数的文档上传到input文件夹下。
新建文档时,之前都是使用touch产生文件,此时这边提供另一种方式:
echo是显示这段文本,其次将这段文本在指向input2.data文件,意思即在文件中写入该文本。此时修改input2.data在其中多增些文本,用于计算。
2.3 上传文本
采取hadoop命令将需要统计单词数的文本上传到hdfs的指定目录下,如下图中所示:
其次查看input2.data的文本,此处使用text命令,得到如下结果:
hadoop dfs –text /data/jobs/wc/input/input2.data
2.4 运行程序
(1)键入命令程序:hadoop jar /opt/modules/hadoop-1.2.1/hadoop-examples-1.2.1.jar wordcount /data/jobs/wc/input/input2.data /data/jobs/wc/output
wordcount后面跟两个参数,一个是需要进行处理的文档目录,还有一个则是处理结果的输出目录,其次就是等待运行。
(2)运行时,用户进入界面接口进行查看。如下图:在runningjobs中的一些具体信息。
命令行中输入的一些信息包括如下截图:
最后一行,显示的Map output records=11,说明输出11行结果。
(3)查看结果。
查看结果可以直接在用户界面接口中直接进行查看,步骤如下:
点入,可以看到本次任务的一些具体信息:
在界面中输入50070端口,进入hdfs系统查看:
可以看到输出目录下有3个文件,success是记录任务运行成功信息,logs是记录本次任务的日志信息,最后一个则是最终的输出结果集,打开可以看到如下:
统计出所有单词数,及其出现次数。
- Hadoop测试-简单分布式程序运行
- Hadoop 伪分布式安装、运行测试例子
- Hadoop运行本地和伪分布式程序
- 使用本地hadoop运行伪分布式程序
- 使用本地hadoop运行伪分布式程序
- 用hadoop运行一个简单程序WordCount
- 用hadoop运行一个简单程序WordCount
- 搭建Hadoop伪分布式环境,及运行wordcount程序总结
- Hadoop完全分布式环境配置及 Word Count 程序运行
- 单机伪分布式运行hadoop
- Hadoop 单机伪分布式运行
- 单机伪分布式运行hadoop
- 运行Hadoop伪分布式实例
- 运行hadoop基准测试
- 运行hadoop基准测试
- 运行hadoop基准测试
- 运行基准测试hadoop
- Hadoop伪分布式模式测试
- android 多线程访问整数问题,请使用AtomicInteger
- 又安好了一个超声波......
- DalvikVM优化的核心-解释器
- 1.Lost in Binarization: Query-Adaptive Ranking for Similar Image Search with Compact Codes笔记
- 解决AJAX请求使PHP反应时间过长的问题
- Hadoop测试-简单分布式程序运行
- 必须类初始化的四种情况
- iphone开发之解决viewWillAppear失效
- CSS中的变量使用详解
- Android: 解决SVN更新项目后报错
- 在搭建ssh框架时,出现找不到该org.springframework.web.context.ContextLoaderListener类
- 通过ajax动态加载select控件【下拉框】的option
- Rerank文章笔记
- 机房收费系统重构(8)——总结