8.在Tachyon运行MapReduce
来源:互联网 发布:js数组长度函数 编辑:程序博客网 时间:2024/04/29 07:57
1.1 使用HDFS做UFS
首先要让hadoop正常识别tachyon文件系统,需要做如下工作:
1)编辑conf/core-site.xml文件,添加如下内容
<property>
<name>fs.tachyon.impl</name>
<value>tachyon.hadoop.TFS</value>
</property>
2)向lib目录放入对应的依赖包(在tachyon-0.5.0/client/target目录下找),名称为tachyon-client-0.5.0-jar-with-dependencies.jar,放入hadoop lib包目录(hadoop-1.0.4/lib) 或者编辑conf/hadoop-env.sh,添加如下内容:
export HADOOP_CLASSPATH=/usr/local/tachyon/client/target/tachyon-client-0.5.0-jar-with-dependencies.jar
3)重启hadoop
1.2 Tachyon命令行访问HDFS数据
将HDFS上的数据加载到Tachyon中:
tachyon loadufstachyon://192.168.2.20:19998/ hdfs://192.168.2.20:9001/ (参数三可选,需要排除的目录)
加载完成后,通过tachyontfs命令查看
[root@mycluster bin]# tachyon tfs cat/hdfs_data
hello world
hello China
hello tom
1.3 MapReduce的WordCount程序计算
(1)Eclipse下开发WordCountDriver程序
(2)运行WordCountDriver
输入路径和输出路径直接访问tachyon分布式内容文件系统。
提交任务:
hadoop jar wordcount.jar cn.WordCountDrivertachyon://192.168.2.20:19998/test.txt tachyon://192.168.2.20:19998/outwc
- 8.在Tachyon运行MapReduce
- 在Tachyon运行Spark应用程序
- 分布式配置 tachyon 并运行Hadoop例子 MapReduce
- 在Tachyon上面运行Spark(中文文档)
- 9.在Tachyon上运行Spark
- How to running hadoop mapreduce on tachyon
- Tachyon
- tachyon
- 如何在Amazon Elastic MapReduce(EMR)上运行MapReduce程序
- 在eclipse上运行MapReduce程序
- 在MyEclipse上运行MapReduce发生错误
- MapReduce在运行时接受命令行参数
- 在eclipse中运行Mapreduce & spark
- 如何在Windows中运行MapReduce程序
- 如何在Windows中运行MapReduce程序
- 在Eclipse中直接运行Mapreduce程序
- MapReduce在YARN上的运行流程
- Spark学习笔记-Tachyon运行Spark
- 点击<a>标签,禁止页面自动跳到顶部的解决办法
- [算法学习]树的广度遍历
- POJ 1860 Currency Exchange(bellman变形)
- PHP之mongodb学习
- csproj OutputType
- 8.在Tachyon运行MapReduce
- LeetCode 2016 290,299,13
- Java对象的强、软、弱和虚引用原理+结合ReferenceQueue对象构造Java对象的高速缓存器
- 9.在Tachyon上运行Spark
- xampp php环境搭建注意事项
- ARM MMU工作原理剖析
- win7上使用vb鼠标滚动
- Eclipse Tomcat Problem Occurred
- 策略模式