hadoop scala 读取文件
来源:互联网 发布:js地球仪特效 编辑:程序博客网 时间:2024/05/21 07:16
第一步 下载IDEA 安装 scala 插件
第二步 新建Scala 项目 TFinn
导入 spark-assemble-hadoop.jar 文件(具体可百度 下载)
我下载的是 spark-assembly-1.3.1-hd-2.6.0.jar 因为我使用的hadoop2.7.3 (吃过亏,嘿嘿) 本来以为版本不一致会出差错,试过可以的。
第三步 编写代码
package main.scalaimport org.apache.spark.{SparkContext, SparkConf}import org.apache.spark.SparkContext._/** * Created by wen on 2017/3/6. */object ReadFile { def main(args: Array[String]): Unit = { val conf = new SparkConf().setAppName("Join").setMaster("spark://xxx:7077") var sc = new SparkContext(conf) var textFile = sc.textFile("hdfs://master:9000/input/text1.txt") println("==========================") println("====count:====",textFile.count()) println(textFile.collect()) println("==========================") sc.stop() }}
第四步 导出 jar 文件
上传到 spark 目录下面
去掉没必要的jar
执行 ./bin/spark-submit --class main.scala.ReadFile TFinn.jar
0 0
- hadoop scala 读取文件
- Scala读取文件内容
- Scala读取HDFS文件
- Hadoop自定义读取文件
- Hadoop 文件读取剖析
- hadoop 读取文件异常
- hadoop-hdfs-文件工具类(Scala)
- 【scala io】scala io操作 txt文件读取和写入
- Scala---文件读取、写入、控制台操作
- spark读取csv文件——scala
- Scala文件操作----(读取和写入字符)
- Scala之文件读取、写入、控制台操作
- scala Source读取文件报错
- Hadoop的整文件读取
- Java 读取 Hadoop 文件系统 文件
- hadoop读取文件流程分析
- hadoop 之 文件读取操作
- scala读取HDFS文件,每次读取一定的字节数
- windows git 学习
- C++必知必会(十五) 指向类的成员的指针并非指针
- hdu 5025Saving Tang Monk(BFS)
- 个人开发工作中常用到的Linux命令 (二)
- 浅谈对象内存分配问题
- hadoop scala 读取文件
- mysql(基础篇)----查询数据
- web前端工程师面试技巧 常见问题解答
- C语言之函数指针和函数的首地址
- 架构设计:系统存储(23)——数据一致性与Paxos算法(上)
- 在不用第三方参数的情况下,交换两个参数的值
- 滴滴大赛的帖子
- java杀死端口号的代码
- c++模板之SFINAE